基于知识图谱的体系架构设计推荐系统构建

(整期优先)网络出版时间:2023-04-22
/ 2

基于知识图谱的体系架构设计推荐系统构建

苏晓霞

中国联合网络通信有限公司天津市分公司 天津市300110

摘要:随着时代的发展和进步,我国的科学技术快速进步,近年来,被广泛应用到各行业使用。本文就系统首先构建一套知识库(包括领域数据库、参考资源库、设计案例库等);然后基于元模型规则映射表,对数据进行深度挖掘和分析,形成可用于体系架构设计推荐的知识图谱数据结构;最后结合推荐算法自动推荐知识图谱中潜在的架构设计过程中需要的关联数据给用户。

关键词:知识库;元模型;知识图谱

引言

数据爆炸式增长和其中的价值对于企业未来的发展具有重要的影响,数据为企业的核心资产。目前企业具备丰富的客户资源和海量的数据积累,在大数据时代企业应重视对数据价值充分的挖掘,以满足时代需求。如何使用数据,对数据价值进行挖掘,使数据成为企业发展的重点,是未来信息技术发展中的重点。为了使大型数据对数据个性化、多样化的需求得到满足,文中设计了统一、高效的数据接口,创建数据精确、便于分析、性能高效的数据仓库系统。利用此方案,能够使上游数据根据应用集市、主题模型实现汇总,以此为下游输出模型化、标准化的数据,使用户需求得到满足。另外,通过数据仓库高效的数据处理能力缩短报表生成的时间,并且使数据统计效率得到提高。将应用业务和技术特点结合实现综合评估,提出了基于大数据的应用架构体系。

1知识图谱构建

知识图谱(KnowledgeGraph/Vault)本质上是语义网络,是一种基于图的、由节点(Point)和边(Edge)组成的数据结构,即知识图谱是以符号形式描述物理世界中的概念及其相互关系的结构化的语义知识库。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱提供了从“关系”的角度去分析问题的能力。实体可以由若干个属性表示,通过实体的属性可以将不同的实体建立关联关系。网络信息体系知识图谱的主要目的是支撑各类智能业务,需要覆盖各类军事活动、人员和作战任务。考虑到当前情报、人员、装备等业务数据库均已与按照业务系统要求设计,无法轻易改变,因此网络信息体系的知识图谱立足当前业务数据库构建,通过本体映射,利用机器学习的方法从已有的结构化、半结构化、非结构化数据库中抽取本体以及本体之间的关系,并进一步通过对本体知识库的元数据抽取形成本体元模型,如图1所示。业务数据、本体知识、本体元模型按抽象层级依次提升。在业务数据库,数据多为实体关系型,如情报人员张三,年龄23岁,军种为陆军。本体映射后,本体知识为情报人员本体,含年龄、军种等属性。元数据抽取后,本体元模型为人员本体,包含年龄、组织等属性,人员属性可以分为情报人员、指挥人员、保障人员等。

图1网络信息体系知识图谱构建关系

2基于知识图谱的体系架构设计推荐系统构建

2.1系统设计要求

复杂巨系统的体系结构设计涉及领域知识众多,对象及对象间的关系错综复杂,单纯依靠人力来完成如此庞大规模的设计工作,这对设计人员在知识和心理上有很大的挑战。因此,基于知识图谱的体系架构设计推荐系统由此而生,利用元模型技术可以快速构建结构严谨的知识图谱,将活动节点之间的相关信息快速关联起来,筛选出基于业务场景的相应解决方案集合,为最终的设计决策提供强有力的保障。系统设计具体要求如下:(1)数据容量大,处理时效性要高;(2)设计要素规则构建要合理且能满足业务未来发展需要;(3)数据类型多样,多源异构数据关联;(4)决策结果准确可靠,既能支持静态不变,也能适应信息动态变化。

2.2数据导入

数据收集能够通过不同数据源实现指定规则数据的提取作业,数据抽取后,存储包括不落地和落地两种,并且为数据转换环节的处理提供输入,还能够直接加载和处理。数据收集使用多样化接口方式,不仅支持传统的FTP文件接口,通过抽取支持实时性分析,还包括批量数据的抽取。数据加载的功能主要包括数据的初始化、压缩加载、文件加载与不落地加载,数据加载功能能够使数据源文件在数据库中保存。在支持加载过程中,事务通过提交参数设置,能够使设置数据文件输入相应路径,并使加载文件匹配规则等信息,通过数据加载实现文件的发现、获取与数据的加载、校验等操作,从而实现数据入库操作。在实现数据加载过程中,不同类别行为分别定义脚本,数据加载执行组件负责行为脚本的调用,在数据库中加载。加载数据结束或者失败,都要对ETL系统中数据日志表实现操作日志的记录,从而能够为后续问题排查与数据稽核提供详细信息。

2.3数据安全防护

在基于区块链的工业互联网平台中,数据安全的防护占据着重要地位,实践中,必须要着重维护平台数据层中所有数据信息的完整性与安全性,防止数据信息泄露、被恶意篡改等问题的发生。为了实现上述目标,在本次平台设计中,主要在该工业互联网平台的数据层、控制层中引入了区块链技术,使得采集到的数据信息、交际记录等均在区块账本保存,提升数据信息的篡改难度,达到维护平台内数据信息安全性的效果。同时,区块链技术还可以实现对身份的限制,避免数据采集设备随意接入平台(即为所有组织的设备配置身份证明),大幅降低数据信息泄露问题的发生概率。

2.4技术架构

遵循“资源-服务-应用”的总体思路,基于知识图谱的网络信息体系下的技术参考模型包括知识图谱构建技术、知识服务技术、知识应用技术,在统一的体系架构标准、资源描述标准、服务协议规范、知识采集分类处理规范、交互和互操作接口标准下,构成完整的总体框架。知识图谱构建技术知识提取、知识表示、知识存储等三类。知识提取包括实体映射、概念抽取、属性定义、实体关联等相关技术,支撑本体的构建;RDF/RDFS、OWL、XML、属性图等表示方法支撑知识的建模和表达;知识图谱主要以图的形式存储于数据库中,典型的数据库包括Google的Freebase、微软的Sa-tori、OrientDB以及PostgreSQL等。知识服务技术包括自然语言处理、机器学习等通用服务以及对启发式搜索、复杂管理查询、推理等知识专用服务。面向最终用户的知识应用包括知识查询、知识推理和规划验证三类。知识查询类应用以人物(Who)、时间(When)、地点(Where)、哪一个(Which)为主,知识推理类应用利用知识图谱中的关系解决如何(How)和为什么(Why)的问题,规划验证类应用以活动为中心,根据活动知识图谱,对任务进行分解规划制定包含时间、地点、人物、活动、目标的具体方案。

结语

本文搭建一种基于知识图谱的体系架构设计推荐系统的框架,该框架基于领域数据库、参考资源库和设计案例库等知识库,在知识库的基础上借助基于元模型的体系结构设计技术、推荐算法和推荐规则对知识数据进行深度挖掘,形成可用于架构设计推荐的知识图谱,同时根据设置的推荐算法自动推荐知识图谱中潜在的架构设计过程中需要的关联数据。本文提出了一种行之有效的智能推荐框架,但是如何进一步深入应用到体系架构设计过程的设计要素推荐中仍有待继续研究。

参考文献

[1]李涛,王次臣,李华康.知识图谱的发展与构建[J].南京理工大学学报(自然科学版),2017,41(1):22-34.

[2]徐增林,盛泳洛,贺丽荣,等.知识图谱技术综述[J].电子科技大学学报,2016,45(04):589-606.

[3]漆佳林,高桓,吴天星.知识图谱研究进展[J].情报工程,2017,3(1):4-25.