数据信息资源整合研究与实践

(整期优先)网络出版时间:2019-11-22
/ 2

数据信息资源整合研究与实践

周虹霞

中国国家博物馆北京100006

摘要:随着信息技术的飞速发展,各类数据、信息资源急速膨胀,由于数据标准规范不统一、兼容性等各方面的问题,导致大量数据信息形成“信息孤岛”,不能及时有效的融合共享,使信息的开放利用、服务社会大打折扣。鉴于此,本文根据当前国家博物馆数据信息资源管理的现状,就解决信息资源整合、共享进行一些可行的研究。

关键词:数据信息;资源整合;元数据

前言

数据信息资源整合过程中最为常见、最为突出的就是数据兼容性问题。由于数据信息的来源和形成环境不一致,数据格式没有统一的标准,数据信息不能集中起来,容易形成“孤岛”,最终导致数据信息资源共享困难,进而影响其利用效果。

1数据信息资源整合途径

1.1统一资源管理软件平台

借助一款适合自身工作环境及情况的信息管理软件是一个较好的途径。长期以来,各单位依据自身的行业习惯、操作规程等条件自主建设软件是造成数据信息不兼容的主要原因之一。信息管理软件的数据库结构、设计模式、实现方法等都不一样,那么要避免数据库不兼容,采用统一的软件管理平台,无疑是最直接有效的办法。但是实施的难度较大,需要统一部署。随着信息技术、网络技术的发展,利用专网统一部署或统一软件平台,采用分布式系统来解决数据信息资源的兼容问题具有一定的可行性。

1.2统一数据格式标准

如果软件平台无法统一,可以尝试建立统一的数据库系统和接口及相关数据标准。数据库是数据资源与应用软件的基础支撑。虽然不同软件使用的数据库结构不一样,但各数据库之间的数据共享和导入、导出还是比较容易实现的。模式化存储数据信息的数据库结构,规范、统一数据字段、命名规范等细节,使得在数据库层面基本保持一致,预留标准统一的数据接口,那么即使软件在数据处理层面、操作层面和视觉层面有再大的差异,对数据信息的共享、利用、整合也不会带来很大影响。统一数据库格式标准对数据信息的利用和兼容性问题处理有着不可替代的作用,能给整合数据信息资源带来非常大的便捷。

1.3统一转换方式

统一转换方式对于解决数据信息兼容性问题有自身的优势,但也有一定的弊端,具有较大的风险性。因为这种方式具有依赖性,它依附于第三方软件,如果第三方软件出现问题,那么就会出现全盘崩溃的局面,会使我们陷入被动的局面,因而在使用中需要更加妥善的管理,并作出相应的灾害预案处置安排。

2数据信息资源现状

国家博物馆信息化建设过程中产生了大量的基础数据资源,数据涵盖国博业务相关的藏品、展览、科研、教育、考古、财务、人员等各方面,资源类型包括多媒体信息、文档信息、数值信息及其他类型。这些数据信息资源存储在各个应用系统中,分散管理。因此,有必要建立统一数据信息资源中心,实现国博信息资源共享和统一数据交换,提供统一的数据展现分析服务,以此提高业务水平和工作效率,为领导管理决策提供数据支撑。

2.1信息类型需求

根据对国博业务管理需求分析及应用领域界定,国博信息化建设对信息资源的需求可以分为基础业务信息、基本统计信息、动态信息、公众信息、服务信息、其他信息5类。

2.2数据资源整体规划

将国博数据资源按不同功能可划分为三大区域,分别是应用业务数据区域、管理数据区域和系统数据区域。

(1)业务数据:主要包括OA数据、邮箱数据、图片影像等多媒体数据、文档及各业务应用系统产生的数据等。

(2)管理数据:包括国博信息化管理所需的标准规范数据、决策分析数据等。

(3)系统数据:包括元数据、基础信息数据、信息资源目录数据。

3信息资源库建设

国博建设综合业务服务平台对应用系统进行整合,其中包含建设信息资源库系统平台。该平台的建设是在系统整合过程中对结构化与非结构化数据的收集、访问、管理、交换和集成,为各相对独立的业务应用(系统)的数据提供了统一的WEB入口和数据协同,它包括以下方面:

(1)结构化数据集成:就是处理多个数据源多数据库之间的数据移动。采用的主要数据处理技术有数据复制、数据聚合和接口集成。

(2)非结构化数据包括图像、文档、网页和媒体等,它们的集成包括非结构化数据的管理、检索、分类、转换、共享、存档等多个方面。

3.1数据库设计

数据库及其应用的性能和调优建立在良好的数据库架构设计基础上。本项目建设应结合国博信息化资源的建设现状和未来发展,进行信息资源数据库的统一设计,包括数据库安全设计与用户权限设计、数据库管理和维护设计。

本系统后台数据库为关系型数据库ORACLE。在数据库开发过程中,要遵循数据库工程的方法和标准,尽可能减少反复。要有阶段性的规范化文档。要加强数据库日志管理,及时检查用户操作日志严防非法登陆。采用防病毒、防火墙、入侵检测等手段防止数据库信息泄露和损坏。加强数据库审计功能,设定审计规则并加强设计检查。

3.2元数据管理

元数据是描述数据库内数据的结构和建立方法的数据,重要的元数据包括数据源结构、目标数据库结构、数据转换规则等,应根据系统总体元数据标准进行元数据提取和著录,形成各共享数据集的元数据应用方案。数据库建设中,可将其按用途的不同分为三类,技术元数据、业务元数据和操作元数据。

(1)技术元数据是数据库设计和管理人员用于开发和日常管理数据库使用的数据。

(2)业务元数据从信息资源建设的业务应用角度描述了数据库中的数据。主要包括数据集描述、指标信息、代码信息、映射规则等。

(3)操作元数据描述数据库的维护及数据更新策略,包括数据库数据刷新频度、用户访问权限、备份和恢复规则、存储管理规则、数据导入导出的历史记录、数据库状态管理和数据库审计等。

4数据信息交换

系统接口是要实现将信息资源完整、规范、及时的转入到系统里。因此计划对接的两个系统需要提出明确的要求,将资源的要求嵌入到已有系统里,综合系统接收的是规范过的数据。数据转换的内容包括描述信息、正文、附件、及处理单以及需要保存的其它信息。

4.1接口的技术实现

(1)由数据提供方和接入方共同制定数据接口规范,采用两种方式实现接口:

建立中间库:数据提供方按照既定的规范,将数据写入到中间库中,数据接入方利用接口程序将中间库中的数据写入到系统中。中间库可以是数据库、文本、XML文件等。

(2)直接转入:按照规范,数据接入方提供接收数据的页面程序,数据提供方调用此页面,同时将符合规范的数据信息传递给此页面,从而将信息接收到系统中。

所用技术包括:

关系型数据库调用:主要包括各种数据库访问技术(如ODBC、JDBC、专用接口等)和文件的访问技术(如http、ftp等)。

XML数据调用:主要是调用DOM对象等工具对XML数据进行解析。

4.2接口的工作方式

(1)用户手动,包括两种方式:管理员利用接口程序先把符合条件的数据展现给用户,由管理员对展现数据进行有选择的转换。

(2)在系统中,当用户进行办结文件时,调用接口程序页面,实时地将办结文件信息传入接口程序页面,该页面可以将传入信息解析后,按照系统规则,存入系统数据库中。

(3)自动运行:接口程序作为一个例程运行在服务器上,按照用户设定的转换周期自动转换数据,能保持数据和业务系统数据的一致性和同步性,从而实现实时存储。

5结束语

本次信息资源库建设是国博对数字信息资源整合的初步尝试,在各方面还存在很多不足,希望通过本次项目经验对国博信息资源建设以后的发展有所帮助。

参考文献

[1]包自毅.地市政府电子政务项目建设的思考与体会[J].信息化建设,2017,(1):40-42.

[2]冯甲策.博物馆信息化架构探索与实践.信息化研究,2018,(02).