学科分类
/ 12
233 个结果
  • 简介:“津税系统”自2002年6月正式立项,于2004年1月在地税南开分局开始试运行,至2005年1月1日,津税系统的十二大部份(模块)已在全市26个基层地税局和市局机关全面运行。津税系统基本满足了天津市地税征收、管理、稽查各项业务的需求,至此,以全市征管数据大集中、统一数据库为特征的新的征管方式取代了原来26个分局分散数据库的征管方式。

  • 标签: 系统 数据模型 ODS 改造 数据大集中 试运行
  • 简介:随着时空数据的爆炸式增长,给数据存储带来高额的成本。为节省存储资源,提出一种基于欧氏距离的几何中心提取压缩的算法。实验结果表明,该算法通过几何中心坐标作为数据特征点,能够有效对时空数据进行高效压缩,具有较高压缩比,且解压后的数据准确有效。

  • 标签: 时空大数据 欧氏距离几何中心 有损压缩算法
  • 简介:由于现在科学技术的迅猛发展以及人民生活水平的不断提升,互联网行业在悄无声息的进入大众的生活中,计算机也被应用在各行各业中。从社会网络到蛋白质交互网络等不同的领域产生了大量的数据,而图作为统计这些巨大数据的一个载体不仅能精确的描述出数据的属性,还能说明数据结构的特征,这些优势让以不确定图模型数据挖掘算法在社会中得到广泛的应用。

  • 标签: 数据 挖掘算法 不确定图
  • 简介:Tri—Training是半监督协同训练的代表性算法之一,它运用统计技术标记置信度,并结合噪音学习理论进行无标记样本分类。当扩充样本训练集不满足噪音学习理论时,会进行随机采样,针对传统Tri-Training算法随机选取基础分类器的扩充训练样本集会引入噪声这一缺陷,通过更改扩充样本训练集选取方式,剔除可能提高分类误差的样本。在健康大数据集上进行一系列验证试验,实验结果表明,改进的算法优于原始算法,降低分类错误率。

  • 标签: Tri—Training 协同训练 分类误差 噪声样本
  • 简介:于复杂的数据库进行快速调度,不仅需要多服务器合作,同时也可能涉及多个数据库之间的数据筛选与查找,而问题的难点在于,不同的数据库在计算机语句设置方面也是不同的,这就意味着查询和筛选的规则以及具体的语言逻辑存在着差异性,这种差异也会影响数据有效调度的效率。基于以上问题,笔者提出一种新的数据库调度方法,其主要基于数据相互混沌的特征,实现复杂数据库的调度。通过并行数据调度技术与混沌优先级因子两种方式的有机结合投入到具体的寻优调度计算中,不仅能够快速将混沌特征进行获取,同时能够结合时间序列计算出具体的数据节点的任务量,最终建立优化模型。结果表明,这一改进模型对于复杂数据库的数据调度有一定的积极作用。

  • 标签: 并行调度 模型仿真 数据库 计算环境 混沌特征 数据筛选
  • 简介:这是一款老少皆宜的休闲益智游戏,很考观察力哦。在游戏中,画面的下方会出现方块、脚丫、星星、月亮、圆圈、雪花等各式各样形状的物体,而玩家需要做的是在规定时间内将这些小东东放在游戏画面上方滚动出现的相应罕格中,当每一行空格都被填满后就会消去,在现定时间内将画面中所有物体消去就算获胜。

  • 标签: 拼盘 模型 益智游戏 游戏画面 观察力 物体
  • 简介:目前,随着面向对象的技术的成熟和广泛使用,关于UML模型的测试方法逐渐成为研究的重点,而且取得了很多的研究成果。该文首先对软件测试的概念和分类进行了介绍,其次简单介绍了UML模型的自动化测框架、测试用例的生成方法、覆盖的规则和测试用例的优化方法。

  • 标签: 软件测试 UML模型 测试用例生成 测试用例集优化
  • 简介:现今的网页制作不仅要有完善的网页功能,还要考虑良好的用户体验。利用DIV+CSS来布局页面已是网页设计的主流,而CSS盒子模型的定位在其应用中是一难点,该文从CSS盒子模型的几种定位方法进行解析,体现其特点。

  • 标签: CSS盒子模型 float定位 relative定位 absolute定位
  • 简介:数据的采集、提取和理解是人类感知和认识世界的基本途径之一,数据可视化为人类洞察数据的内涵、理解数据蕴藏的规律提供了重要的手段。随着数据时代的来临,大数据的分析、挖掘与可视化已经成为信息技术发展的迫切需求。面对当前科学可视化、信息可视化、可视分析研究和应用的新形势,

  • 标签: 数据可视化 丛书 科学可视化 信息可视化 信息技术 可视分析
  • 简介:用户访问数据中往往存在大量无用或与当前信息挖掘无关的数据,我们通过数据清洗从挖掘对象中去除不相关的数据,并实现了用户识别、会话识别、格式化等步骤,对WEB信息进行预处理,为进一步的操作提供了较好的数据格式,提高了挖掘效率。同时,因特网上的信息往往具有非结构化或半结构化特性,难以得到传统数据挖掘技术的支持,我们通过事务识别技术解决了这一问题,将访问序列组织成逻辑单元以表示事务或用户会话,将所有事务组成一个事务数据库,识别出事务后就可以利用对传统数据挖掘的方法对WEB数据进行挖掘:事务识别技术有多种实现形式,不同形式有不同的应用场合,本文根据特定挖掘任务,实现了以时间维来分割事务的算法,并给出了一些实验数据

  • 标签: 数据库 数据处理 数据库管理系统 WEB 数据挖掘 数据格式
  • 简介:数据是毋庸置疑的技术趋势和话题焦点,但是多数情况下,可能人们都太纠结大数据“是什么?不是什么?”,这让话题看起来永远都不会有结论。而本书作者另辟蹊径,在另外的角度上对这一趋势进行解读,即什么才是大数据的正确之路。现在我们就好像身处大数据技术演进的寒武纪时代,在这个技术变革时期,各种技术粉墨登场,快速演化。而这恰恰是人们对现有大数据技术一切疑惑和模棱两可观点的源头,也正是作者在开篇第1章和结尾表述的观点。因为我们身处变革当中,所以很好理解为什么作者并不急于回答“大数据是什么“。只要翻翻这本书,你一定会发现它和市面上其它大数据书籍的不同。

  • 标签: 大规模分析 海量数据 寻路 技术演进 技术变革 数据技术
  • 简介:数据仓库是数据库的发展方向之一,对企业管理和决策支持起着重要的辅助作用。简要介绍了数据仓库和元数据的基本概念,重点阐述了元数据数据仓库系统中的作用、管理及维护,并就元数据库具体的实现方式进行了初步的研究和探讨。

  • 标签: 数据仓库 元数据 元数据库
  • 简介:在模糊查询条件下,针对同一关系中的不同属性的取值的差异性造成查询结果不准确的问题,通过方差压缩的思想对原数据进行标准化处理后再进行模糊查询,并进行实例验证。

  • 标签: 关系数据库 模糊查询 隶属函数 匹配度 方差
  • 简介:随着大数据时代的到来以及云计算、物联网等技术的快速发展,人类产生的数据量每年呈指数级增长,此外数据类型与格式的变化和扩展性、响应速度等方面的需求也对传统的数据存储与处理技术带来很大挑战。本文首先主要从Hadoop、NOSQL和流数据处理技术等方面介绍了为应对大数据带来的挑战而诞生的新技术,并分析其理论基础与基本架构。旨在为了解大数据当前发展状况、关键理论与技术以及更准确认识基本框架提供参考。

  • 标签: 大数据 HADOOP SPARK NOSQL 流数据
  • 简介:支持向量机是机器学习和数据挖掘领域的热门研究课题之一,作为一种尚未完全成熟的技术,目前仍有许多不足,其中之一就是没有统一的模型参数选择标准和理论。在具体使用中,对支持向量机性能有重要影响的参数包括惩罚因子C,核函数及其参数的选取。文章首先分析了模型参数对支持向量机性能的影响,然后对几种常用的模型参数选择方法进行介绍,分析以及客观评价,最后概括了支持向量机模型参数选择方法的现状,以及对其发展趋势进行了展望。

  • 标签: 支持向量机 模型参数选择 惩罚因子 核函数 核参数
  • 简介:我国大数据具备了良好的基础,也面临着重大的机遇,但要实现从数据大国向数据强国转变,还面临很多的制约和挑战。“十三班”是我国全面建成小康社会的决胜期.是信息通信业发展大数据的战略机遇期,全行业应积极贯彻中央有关决策部器,推动大数据健康发展。

  • 标签: 健康 信息通信业 小康社会
  • 简介:在智能计算机辅助概念设计系统中,功能是表达产品本质的重要属性,功能分解是功能设计的重要内容。从智能设计的角度出发,在功能定义的基础上,对功能分解的相关理论进行分析研究,探寻基于进化设计思想的产品功能基因编码表达方法及产品功能分解智能优化的关键实现技术,以期为深入研究实用的、符合工程设计要求的计算机辅助概念设计系统提供有益参考,并结合工程实例进行验证。

  • 标签: 计算机辅助概念设计 功能定义 功能分解 功能编码 遗传算法 智能优化