数据挖掘技术在电子政务中应用

(整期优先)网络出版时间:2018-01-11
/ 2

数据挖掘技术在电子政务中应用

郭威

(身份证号码:44142219900915XXXX)

摘要:电子政务工程因在推动政府转变传统管理方式、提高政府工作效率、推动政府公开透明、规范政府执政行为等方面起到积极作用,得到了世界各国政府的普遍关注。得益于计算机技术以及网络通信技术的飞速发展,电子政务技术也随之不断成熟,应用日趋广泛,在各国政府及相关职能部门的业务系统中日益积累了大量数据。由于传统的数据处理手段对数据量大的业务系统做深层次数据处理效果不理想,对数据的潜在有用信息不能更好地识别和利用,日渐满足不了不断深化的电子政务应用的需求。同时在电子信息技术广泛应用的今天,新兴产业、创新科技已成为引领时代进步的关键,传统的管理手段无法满足政府监管的需求。数据挖掘技术作为近十年来不断发展成熟的数据处理技术,日益在政府部门的日常工作中得到广泛的运用。鉴于上述方面,研究数据挖掘技术在电子政务领域中的应用就显得尤为重要。

关键词:数据挖掘技术;电子政务;应用研究

随着电子政务和网络用户对高品质、个性化的信息需求的不断扩大以及对新兴事物有效监管的需要,将对网络数据挖掘技术提出更高的要求。本文将数据挖掘技术优势结合政府工作特点,论述了数据挖掘在电子政务中各方面的应用。

1.数据挖掘技术介绍

1.1数据挖掘的概念

数据挖掘,又称数据采掘、数据开采,是指从大型数据库的数据中提取人们感兴趣的知识,而这些知识是隐含的、事先未知的、潜在的有用信息。原始数据可以是结构化的,如文本、图形、图象数据,甚至是分布在网络上的异构数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以用于信息管理、查询优化、决策支持、过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门广义的交叉学科,它汇集了不同领域的研究者,尤其是数据库、人工智能、数理统计等方面的专家。数据挖掘工具是一种挖掘型的分析工具,其重点在于预测。数据挖掘有两个任务:其一为机器的数据库理解,将数据库变换为在表述上可为计算机理解的更为简洁的模型,然后利用这个模型求解新问题;其二为数据库理解,根据需求简化数据并将其翻译为自然的表示形式(如:数学公式,自然语言与图表等),发现隐含在大量数据中的规律并使之能为人理解。数据挖掘可以从实例数据中直接导出规则,用于构造知识库;也可在数据库中对已有规则进行验证,因此对知识库的维护和更新也是有用的。

1.2数据挖掘的主要方法

数据挖掘的技术基础是人工智能。但它仅仅利用了人工智能中一些已经成熟的算法和技术,如:人工神经网络、遗传算法、决策树、邻近搜索方法、规则推理、模糊逻辑等,其问题的复杂度和难度比人工智能要低许多。数据挖掘系统利用的技术越多,得出的结果精确性就越高。这主要取决于问题的类型以及数据的类型和规模,无论采用哪几种技术来完成任务。

2.数据挖掘在电子政务中的必要性

前面谈到,电子政务中的数据挖掘技术是基于网络的,即所谓的网络数据挖掘。使用数据挖掘技术,可以发现:反映同类事务共同性质的知识、反映事务各方面特征的知识、根据历史的和当前的数据能够推测未来数据的预测型知识。同时还能揭示事务偏离常规的异常现象。所有这些知识都可以在不同的概念层次上被发现。至于发现工具和方法,常用的有分类、聚类、减维、模式识别、可视化、决策树、遗传算法、以及不确定性处理等。将网络数据挖掘技术引入电子政务中,可以大大提高整个电子政务系统的智能化水平。其在电子政务的必要性主要体现在以下方面:

2.1处理电子政务庞大的信息量

近年来政府职能转变,要求政府服务水平不断提高,配合精细化管理的需要,所需处理的信息已由原来粗放型转变为细化型,可以说政府部门包含了社会上企业、个人以及各行各业的所有信息,如此大的数据量加上多年来积累下来的业务数据的整理也是一项繁杂的工作。再有,由于各级政府部门实行信息化建设的规模和程度各不相同,各个数据库管理信息系统对数据的存储格式也不尽相同,这使得无论是在数据共享,数据应用,数据整理上都存在很大的困难,降低政府部门工作效率,因此建立数据仓库,整理和归并各种形式的数据,是电子政务实施商务智能首要解决的问题。在这过程中,主要是将政务系统中各个面向应用的数据重新按照面向分析的方式进行组织,并依照数据仓库的主题,将各种数据源中的信息在抽取和转换中,逐步缩小业务数据和分析数据之间的差异,还要在对数据转移的全过程中采用专门的元数据进行控制。

2.2为政府重大政策出台提供决策支持

数据挖掘的主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取公共建设、公共管理、民生、环保、金融等重大决策的关键性数据,在电子政务中主要用来为政府重大政策出台提供决策支持。如通过对网络各种经济资源的挖掘,确定未来经济的走势,从而制定出相应的宏观经济调控政策。简单的一个例子就是在对经费拨款申请等类似问题上,容易出现欺诈行为。在各级上报的申请单据中,我们很难确定存在欺诈的单位,以及具有欺诈倾向的因素。我们可以收集相关申报数据,通过数据挖掘制定一个防欺诈的方案,那么我们就可以分离出导致欺诈和滥用行为的因素,制定规则来标识出最有可能具有欺骗性的记录和经费申请单据,使审核人员可以核查不仅是可能有欺骗性,而且是有最大调整空间的经费申请,加强对资金使用的监管。

2.3是电子政务发展的要求

从整个世界范围来看,电子政务还没有真正的实现。各国政务信息化的进度不一、规模不同。随着建设服务型政府的要求,精细化、管理,高标准建设的新时代要求,民众对高品质、个性化信息需求的不断扩大,以及网络相关技术的不断更新,会对电子政务系统的建设提出更高更具体的要求,这也将推动电子政务系统不断地完善,更好地向着政务智能化的方向发展。数据挖掘作为数据处理的先进技术,将为电子政务的发展起到良好的推动作用。

3.政府电子贸易中的应用

电子政务中数据挖掘技术的具体应用之一是政府电子贸易,对于用户的访问模式以及相关行为方式进行挖掘,挖掘的“地点”是服务器、浏览器端等的日志记录数据,其中隐藏有海量的模式信息,这时应用Web日志挖掘就可以对电子政务中政府电子贸易起到相当程度上的辅助作用,其能够自动的发现系统中的相关访问模式以及用户的行为模式等,从中对其进行具体的预测分析。在政府电子贸易这一方面的具体应用,譬如说,通过数据挖掘技术在对用户的一些信息资源,类似资源浏览所花费的时间这一数据进行挖掘,那么最终的数据显示加上对于数据的分析预测,就可以非常明确地判别出用户对于哪一部分、那些信息资源更感兴趣,继而就可以做出更为个性化的服务。现如今,数据挖掘技术在政府电子贸易中得到了非常有效的应用。

基于数据挖掘技术自身属性,其最主要的特点就是能够对政务数据库中存储的大量业务之类的数据做出抽取、分析、转换或者各式各样模型化的处理,从而从中提取一些关键性的内容,其作为政府部门重大决策的关键依据当仁不让,为重大决策的出台和实施提供了强有力的决策支持。数据挖掘技术在电子政务中进行相关内容的挖掘,并提供出最终设想是数据挖掘技术最为基本的功能之一。譬如,通过对于政府网站以及政府公众网站等的信息进行大量搜集,之后应用数据挖掘技术进行有用信息的挖掘,继而就可以得到那些能够为政府工作起到提高作用的有益知识,相关政府部门工作人员从中获取到科学实用的辅助决策支持;又如,在12345信箱中,各级地方政府就可以直接获取到市民对于政府工作的意见和看法,继而就可以据其做出相关工作计划和决策;再如,如今共享经济热潮正在整个社会漫延,对于此种新兴事物,既没有相应的法律法规约束,同时政府部门又不能放任让其野蛮生长,对此,大数据信息的采集和分析不仅对政府制定相应监管方式起关键作用,而且可大大提高监管方式的可行性,减少对人民群众生活方式的影响。

结论

总而言之,数据挖掘技术作为一种新型的技术和科学,其诞生到现在短短十几年里,广泛受到了各行各业相关研究人员的研究兴趣。当前而言,它堪称近几年对于我们人类生湖泊影响力最大的IT技术之一。只是现阶段而言,它的发展毕竟仍处于幼年期,在很多方面所取得的成功也只能定位为初步阶段,想要使得数据挖掘技术能够在电子政务中得到充分并且广泛的应用,就必须从多方面着手,敢于应对、面对大量的挑战课题,给予其足够的重视,从而最终提供出最为合理、可靠、科学、准确的服务。

参考文献:

[1]金江军,潘懋.电子政务数据资源的开发利用[J].地理与地理信息科学.2003(06)

[2]陈琰.基于数据挖掘的保险公司客户评估与管理研究[D].哈尔滨理工大学2008

[3]王卫军,付晓江.基于三层体系结构电子政务系统的JSP技术.吉林大学学报(信息科学版),2003(21):87-91