面向主题的医疗费用分析数据仓库建模

(整期优先)网络出版时间:2009-11-21
/ 2

面向主题的医疗费用分析数据仓库建模

李慧宗张学森

李慧宗张学森(安徽理工大学)

摘要:通过对数据仓库概念模型、逻辑模型、物理模型的分析与研究,建立“医疗费用分析”数据仓库的模型,为医院建立医疗数据仓库提供了基础,有利于促进医院信息化建设的发展。

关键词:医疗数据仓库粒度划分星型模式

0引言

在激烈的市场竞争中,正确及时的决策是医院生存与发展的关键。医院日常的业务处理系统中存储了大量的数据,但是因为它是面向业务操作设计的,无论是查询、统计还是生成报表,其处理方式都是对指定数据进行简单的处理。虽然简化了具体操作人员的劳动强度,但不能对这些大量数据所包含的内在信息进行提取,医院并没有获得真正的决策支持。

调查研究表明,大多数医院并不缺少数据,而是受阻于过量的冗余数据和数据不一致,甚至大量的历史数据被束之高搁。随着数据量的快速增长,数据变得越来越难于访问、管理和用于决策支持。利用现有的医院数据资源建立医院的数据仓库系统,可以很好地解决这些问题。数据仓库系统主要实现OLAP功能,用于对数据进行多维分析。数据仓库建模是整个数据仓库系统的核心。数据仓库建模用于组织和管理数据,以提高数据的分析和汇总效率。数据仓库的建模反映出数据仓库主题的逻辑规则以及用户对查询范围和查询深度的需求。

1概念模型设计

数据仓库的概念模型是面向企业全局建立的,一方面,要对企业现有数据库中的数据内容有一个完整而清晰的认识,另一方面,要充分了解决策者对数据分析的需求,通过确定系统边界和定义主题域反映出数据仓库的概念模型。

1.1界定系统的边界从建立数据仓库的初衷来看,医院领导迫切需要掌握医疗费用的分布情况、药费占整个医疗费用的比例以及大型医疗设备的利用情况,以便控制不合理的费用增长,针对不同类型的患者调整收费项目和收费标准,从而达到提高服务质量、优化医院经营管理环境的目的。因此,系统设计应满足上述需求。此外,医疗费用从另一个方面反映了全院各科室的医疗收入情况,据此可以评价科室工作业绩,评估收入分配指标,便于制定合理的医疗设备配置方案。

1.2确定主要的主题域通过对医院管理数据库系统进行认真分析,确定了以“住院医疗费用分析”为主题建立医院数据仓库。以“医疗费用分析”为主题建立数据仓库的多维概念视图设计为按时间维、患者维和医疗费用维组织的多维数据集,其中,时间维分为年、季、月、日四个级别;患者维分为医院管理小类和管理大类两个级别:费用类别维分为医院管理细节类和医保大类两个级别。通过在各维间建立交叉组合进行多维数据的动态分析,用于分析不同时间、不同就医人群采用不同医疗方式所产生的各项医疗费用。

2逻辑模型设计

2.1数据的组织结构数据仓库中的数据存在不同的综合级别。一般将数据仓库中的数据分为四个级别:早期细节级、当前细节级、轻度综合级、高度综合级。源数据经过转换装入数据仓库后,首先进入当前细节级,并根据具体要求进一步综合,从而进入轻度综合级乃至高度综合级,老化的数据将进入早期细节级。

2.2粒度(GranularityofData)划分进行粒度划分可以提高数据仓库的查询效率,数据粒度的划分要根据用户的业务需求而定。在划分粒度时,首先,估算数据仓库中数据的行数和DASD(DirectAccessStorageDevice)数;其次,由估算出的数据量和DASD数,决定如何划分粒度;再次,需要根据DASD以及用户的业务需要来确定是采用单一粒度还是多重粒度、以及粒度划分的层次。

经过分析,医疗费用分析数据仓库系统应该采用双重粒度划分的方法。具体作法是,每月月初将源业务处理系统当前数据加载到数据仓库中,源业务处理系统中医疗费用数据记录是根据医生医嘱随时录入的,所以一天当中,可能会出现多笔相同类型的医疗费用(如各种药费)。进行数据集成时,对每位患者当日发生的医疗费用按照医疗费用详细类别进行汇总,以减少数据行数。每月进行一次数据追加,年底以月为基本粒度单位进行综合汇总。例如,当前年度内的数据是以日为单位记录的,成为当前详细数据层,由源业务处理系统数据库中析取和集成后直接导入;一年以上数据以月为单位进行综合,成为历史数据层,用于纵向对比分析和预测。

2.3数据模型系统采用星型模式的逻辑数据模型。在星型模式中,维表直接与中心事实表连接,避免了维度中的级别被分散在若干个表中,因此可以优化数据仓库的查询响应时间,提高查询性能。星型逻辑模型如下图所示。

3物理模型的设计

基于逻辑模型的设计,在物理模型的设计上系统采用星型模式建模。

星型模式由事实表和维表组成,多个维表之间形成多维数据结构,星型模式的数据体现了空间的多维立方体。星型模式的好处是,进行信息检索的连接更少,通过数据预连接和建立有选择的数据冗余,简化了数据访问和分析过程,这种高度集中的数据为各种不同决策需求提供了有用的分析基础。星型模式可以优化数据仓库的查询响应时间,提高查询性能。

星型模式由一个事实表和若干个维表组成,事实表包含OLAP多维数据集中所有的度量以及由各维度表主键构成的组合主键;每个维度表都有一个主键,而且该主键作为事实表中组合主键的一部份:每个维度表通过一个关键字直接与事实表关联,维度关键字是用于查询事实表数据的唯一标识符。

4结语

利用医院现有的数据系统,设计“医疗费用分析”数据仓库的各种模型,为进一步建立医院数据仓库系统提供了基础。

参考文献:

[1]林宇.数据仓库原理与实践[M].北京:人民邮电出版社,2003.

[2]石丽,李坚.数据仓库与决策支持[M].北京:国防工业出版社,2003.

[3]吴静等.基于Web的HIS系统低端数据库访问方法研究[J].数理医学杂志,2003,16(1):72-73.

[4]冯诗齐.数据仓库技术在医院药库管理中的应用[J].中国药房,1998,9(1):24-25.

[5]郭云飞,孟志青.医院门诊收费数据仓库系统的分布并行结构设计方案[J].微型机与应用.1999.18(2):41-43.

基金项目:安徽省高等学校自然科学研究项目(KJ2009B172Z)