学科分类
/ 25
500 个结果
  • 简介:通过对Web服务器日志文件进行分析,可以发现相似客户群体、相关Web页面和频繁访问路径.在本文算法中,首先以Web站点的URL为行、以UserID为列建立URL-UserID关联矩阵,其元素值为用户的访问次数.然后,采用模糊聚类算法和K-平均算法两种方法分别对列向量进行分析得到相似客户群体,对行向量进行分析可获得相关页面,对后者再进一步处理还可以发现频繁访问路径.实验结果表明了算法的有效性.

  • 标签: WEB日志挖掘 Web服务器 K-平均算法 模糊聚类算法 访问路径 Web页面
  • 简介:本文通过探讨数据挖掘在电子商务中的应用,阐述了数据挖掘的原理,数据挖掘与电子商务工者完美结合的可行性以及如何对电子商务网站的Web数据进行挖掘

  • 标签: 数据 数据挖掘 电子商务 模式 分析 规则
  • 简介:Web日志中用户访问数据的挖掘可以很好的获得系统优化的信息,方便Web站点走向个性化、智能化道路。本文深入了解了Web日志格式的内容,研究了进行Web日志挖掘的一般流程。采取预处理的方式来获得用户有用信息,经过数据清理、用户识别、用户会话识别、界面过滤、路径补充来完成信息的有效汲取,最终通过模式发现和模式分析来完成对使用者感兴趣信息的传送工作,将Web日志挖掘技术真正应用在站点优化进程中。

  • 标签: 数据挖掘 WEB日志挖掘 数据预处理
  • 简介:Web服务器日志记录用户访问该教学网站时每个页面的请求信息,可以根据用户访问的Web记录挖掘用户的兴趣关联规则,对Web服务器上的日志、用户信息等数据所开展的挖掘工作也属于Web数据挖掘的范畴

  • 标签: 中的应用 挖掘网络 日志挖掘
  • 简介:介绍电子商务和Web数据挖掘的概念,并介绍Web使用挖掘中应用最多的技术——Web日志挖掘.重点阐述了日志挖掘算法——关联规则的有关知识,以及改进的频繁项目集生成算法Apriori和强关联规则生成算法,并结合实例进行了分析研究.

  • 标签: 电子商务推荐 WEB日志挖掘 关联规则
  • 简介:Web中汇集了丰富的动态的信息。如何对这些信息进行有效的分析,已成为现今研究的热点。用OLAP技术,建立Web数据立方体的方法,对Web日志进行处理,能改善网站决策的科学性和时效性,强化可行性研究,提高网站的运行效率。

  • 标签: WEB日志 OLAP 数据立方体
  • 简介:用户访问数据中往往存在大量无用或与当前信息挖掘无关的数据,我们通过数据清洗从挖掘对象中去除不相关的数据,并实现了用户识别、会话识别、格式化等步骤,对WEB信息进行预处理,为进一步的操作提供了较好的数据格式,提高了挖掘效率。同时,因特网上的信息往往具有非结构化或半结构化特性,难以得到传统数据挖掘技术的支持,我们通过事务识别技术解决了这一问题,将访问序列组织成逻辑单元以表示事务或用户会话,将所有事务组成一个事务数据库,识别出事务后就可以利用对传统数据挖掘的方法对WEB数据进行挖掘:事务识别技术有多种实现形式,不同形式有不同的应用场合,本文根据特定挖掘任务,实现了以时间维来分割事务的算法,并给出了一些实验数据。

  • 标签: 数据库 数据处理 数据库管理系统 WEB 数据挖掘 数据格式
  • 简介:摘要随着Web技术的日渐成熟,使基于这一技术的Internet应用以惊人的速度向社会生活的方方面面渗透。Internet的应用的普及使得数据挖掘技术的重点已经从传统的基于数据库的应用转移到了基于Web的应用。以Web服务器日志为例某些Web热点的日志数据正以每天数十兆的速度增长从这些大量数据中发现有用的重要的知识包括模式规则可视化结构等是数据挖掘与知识发现的又一重要研究和应用领域。文章就Web挖掘技术的概念、分类及文本挖掘和用户访问模式挖掘的实现技术做了详细的阐述。

  • 标签: Web挖掘 文本挖掘 用户模式挖掘
  • 简介:对基于Web日志的数据预处理过程做了相关研究,特别关注于用户识别和会话识别的启发式规则,对会话识别中基于时间的两条启发式方法进行了改进,形成新的基于时间的方法,并结合获取的数据予以验证,讨论分析了验证结果。新的方法提高了会话识别的准确性,为下一步的数据挖掘打下了基础。

  • 标签: WEB日志 数据挖掘 数据预处理 会话识别
  • 简介:目前网站的安全问题日益严重,分析Web日志记录是最直接、最常用,并且是一种比较有效的方法。文章介绍WEB日志的功能并通过实例说明如何利用日志发现黑客入侵方法,进而作出防范。

  • 标签: WEB日志 SQL注入漏洞 上传漏洞 黑客入侵
  • 简介:Web数据挖掘是数据挖掘技术与Web技术相结合的产物.Web使用挖掘Web数据挖掘的一个分支.本文主要深入分析了以下几个方面:Web使用挖掘的相关概念、挖掘流程和挖掘的关键技术.

  • 标签: 数据挖掘 WEB挖掘 WEB使用挖掘
  • 简介:充分的挖掘网络中的用户信息,就可以使我们建立一个智能化与个性化为一体的网络教育平台提供资料。本文在前人的基础上,给出了一个改进的数据挖掘算法,以此发现相似学习者群体、相关web页面和频繁访问路径。以此挖掘的信息我们就可以提高网站的建设和网络教育的质量。

  • 标签: 网络教育平台 数据挖掘算法 学习者 个性化 建设 信息
  • 简介:根据用户的兴趣需求信息建立个性化模型,提出一个基于用户兴趣挖掘的个性化模型,更新与优化模块是对兴趣类特征词和兴趣类信息进行有选择的遗忘

  • 标签: 个性化模型 挖掘个性化 模型研究
  • 简介:对Apriori算法进行优化,提出了一种Z_Apriori算法。该算法在首次产生频繁项集时。扫描数据库并通过二进制编码串记录每个项目在事务里是否出现过,在每次进行计算迭代过程中无需再对数据库进行扫描.避免了对数据库的重复扫描,在系统性能和效率上较经典的Apriori算法有一定的改善。

  • 标签: 关联规则 个性化推荐服务 频繁项集
  • 简介:将数据挖掘引入教育网站的建设中,以解决访问信息的有效获取问题,介绍了教育网站数据挖掘的意义,对数据挖掘的基本流程与结果进行了分析和探讨,提出了在站点中自动发现那些存储位置同用户期望的位置不同的Web页面的方法.

  • 标签: 教育网站 数据挖掘 WEB 访问模式 数据矩阵 超链接结构
  • 简介:摘要:由于WEB系统在外网中需要频繁地使用,为了保持系统的稳定性和数据的安全性,准确检测出网络中的异常行为也变得更加有价值。本文关注及分析了日志数据的主要基本特征,并据此提出了以分类算法为核心的网络异常行为检测算法。

  • 标签: 系统优化 审计日志 数据展示 数据处理
  • 简介:本文介绍了Web数据挖掘的定义、分类以及特点,阐述了Web数据挖掘在结构化数据方面所具有的速度快、准确性高等特点,并从HTTP交互模块与HTML解析模块分析了Web数据挖掘的原理与流程,并重点介绍了基于Python计算机程序语言的Web数据挖掘设计。

  • 标签: PYTHON 大数据 数据挖掘 数据处理
  • 简介:摘要:随着互联网的普及,Web安全已成为公众、企业和政府部门关注的焦点。Web安全漏洞可能导致数据泄露、信息篡改、服务瘫痪等严重后果。本文旨在探讨Web安全漏洞的挖掘方法和修复策略,通过实际案例分析,为We开发者和安全工程师提供一套系统性的漏洞挖掘与修复方法。

  • 标签:
  • 简介:近年来,数据挖掘(DataMining)引起了信息产业界的极大关注,其主要原因是通过数据挖掘可以将大量数据转换成有用的信息和知识。本文讨论在一个具体的电子商务网站环境下,Web挖掘模式对客户分类的支持作用。

  • 标签: 电子商务 数据挖掘 WEB挖掘
  • 简介:随着互联网的高速发展,Web挖掘由于其独特的优点,在电子商务的应用中扮演了越来越重要的角色。文章主要介绍了web挖掘的概念和分类,论述了电子商务中Web挖掘的过程和方法,最后阐述了Web挖掘在电子商务中的具体应用。

  • 标签: WEB挖掘 电子商务 数据挖掘