窗体顶端
【论文题名】 智能网页推荐系统的相关技术研究
【论文作者】 李建祥
【作者专业】 计算机应用技术
【导师姓名】 戴齐
【授予学位】 硕士
【授予单位】
西南交通大学
【授予时间】 20040501
【 分类号 】 TP393.092; TP311.13
【 关键词 】
数据挖掘; 智能网站; 页面推荐; 关键路径; 复合后缀树
【 摘 要 】 互联网的迅速发展与普及,日益成为人们获取知识和信息的重要手段.它在提供给人们大量信息的同时,也带给人们检索信息的困难.如何帮助用户方便快捷地获得他们所需要的信息是互联网进一步发展所必需面对的一个问题.该文在对这一问题进行深入研究的基础上,结合文本挖掘与日志挖掘两种方法,提出了一种智能网页推荐系统的构建方法.这一系统可以根据用户以前的访问信息为用户在线推荐他所感兴趣的页面.该文首先在对人们访问习惯进行系统分析的基础上,提出:将用户的访问事务区分为导航路径和兴趣页面集两部分;将WEB页区分为链接页面和内容页面两类.其次,提出从导航路径中利用构造复合后缀树的方法来挖掘用户关键路径,并利用关键路径将用户聚类成不同的兴趣群.根据兴趣群为用户确定一个初步的页面推荐集.为了更精确地识别用户兴趣,作者还提出利用关键路径来构造用户兴趣词集.最后,论文中定义了计算页面对用户的相关度计算公式.根据计算结果确定精确的推荐页面集为用户进行动态推荐.文中详尽地给出了系统的构建流程和实现算法,并对算法的复杂度进行了初步的分析.分析结果表明该方法复杂度较低,易于实现.
【文摘语种】 中文文摘
【论文页数】 1-50
基于Web的个性化服务技术与研究
【论文题名】 基于Web的个性化服务技术与研究
【论文作者】 吴琪
【作者专业】 计算机应用技术
【导师姓名】 胡明
【授予学位】 硕士
【授予单位】
长春工业大学
【授予时间】 20040301
【 分类号 】 TP311.13; TP393.0
【 关键词 】
个性化;
用户概貌; Web访问日志
【 摘 要 】 Internet是海量信息源,由于信息不断地更新和增加,人们很难在短时间内找到自己的目标.解决这些问题关键在于将Internet从被动接受浏览者的请求转化为主动感知浏览者的信息需求,实现Internet系统对浏览者的主动信息服务.新一代的信息服务将是个性化主动信息服务,该论文参考了前人所做的工作,讨论了设计个性化服务系统的几个关键问题:1)用户浏览行为信息的采集2)个性化用户模型的构建;3)个性化用户模型的更新;4)个性化用户模型的应用-如何过滤与用户无关的信息.在此基础上,讨论了将Web Usage Mining和用户兴趣主题结合起来,构建个性化Web用户模型的方法,并采用了二级采集用户兴趣的方法.该论文构造的系统-Per nerms(Personalized net educationmanage
system),是基于客户端浏览器的个性化服务系统.我编码实现了一个浏览器插件,可以捕获用户在浏览器上的行为,它提供了捕获用户访问行为信息的接口.在Per nerms中,采用Web访问挖掘的方法,分析客户端用户的浏览行为数据.该系统中的Web访问挖掘包括了如下几个步骤:1)数据清理2)会话识别;3)事务识别,产生事务数据库;4)生成聚集树;5)生成关联规则.最后Per
nerms中的个性化用户模型的有效性,要通过推荐模块的效率和精确度来验证.该论文主要完成工作:l、实现了在客户端准确的获取用户访问行为数据和在应用服务器获得用户兴趣的二级采集用户兴趣的方法;2、实现了根据用户的浏览行为习惯,向用户推荐相关信息的方法.3、构造了有效的用户兴趣模型.4、设计了一个基于WEB的个性化服务系统的原型框架.
【文摘语种】 中文文摘
【论文页数】 1-52
Web挖掘及其应用
【论文题名】 Web挖掘及其应用
【论文作者】
张海强
【作者专业】 通信与信息系统
【导师姓名】 张永
【授予学位】 硕士
【授予单位】 兰州理工大学
【授予时间】 20040501
【 分类号 】 TP311.13
【 关键词 】
知识发现;
数据挖掘; Web挖掘;
Web使用挖掘;
Web拓扑概率模型; Web日志预处理; 关联规则; 序列模式分析; 分类;
聚类;
电子商务;
用户; 会话; 个性化; 可扩展标记语言; Cookie
【 摘 要 】 随着Internet技术的发展,网络服务和电子商务逐渐显露出它们所蕴藏的巨大商机."Web挖掘技术的应用研究"正是基于这一背景提出来的.作者在硕士论文研究阶段,以Web挖掘技术的应用作为研究背景,介绍了数据挖掘,Web挖掘和Web使用挖掘技术的理论发展及实际应用,并重点研究了Web使用挖掘中数学模型的建立和算法改进的具体过程.论文涉及内容广泛,主要有以下几部分组成:1、详细讨论了数据挖掘技术的基础理论:包括数据挖掘产生的背景,它的定义和技术分类等等.2、着重介绍了Web挖掘技术所涉及到的各个方面,包括Web挖掘产生的背景,它的定义,分类和特点等.3、在Web使用挖掘技术的某些前沿领域中所作的探索性尝试和努力是该论文的重点所在.针对基于日志的Web使用挖掘提出了一种数据预处理方法并给予了很好的算法实现,目的是分割服务器日志为多个独一无二的用户的一次访问序列.4、最后描述了XML技术的特点并展望了它在Web挖掘中的应用以及Web使用挖掘在电子商务方面的应用.并给出了一个电子商务中Web使用挖掘的具体实例.
【文摘语种】 中文文摘
【论文页数】 1-41
基于Web用途数据预处理的聚类挖掘研究
【论文题名】 基于Web用途数据预处理的聚类挖掘研究
【论文作者】 张琦琪
【作者专业】 计算机应用
【导师姓名】 陈俊杰
【授予学位】 硕士
【授予单位】
太原理工大学
【授予时间】 20040501
【 分类号 】 TP311.13
【 关键词 】 Web用途挖掘; 聚类;
会话;
页面视图;
点击流; 最长共同子序列
【 摘 要 】
超级链接,作为一种连接万维网上分散信息的媒介,正以惊人的速度被大量使用.它在为我们提供丰富资讯的同时,也对如何详细的分析上网用户的行为以及网上资源的特点提出了挑战.随着网站的容量和复杂度的增加,只是对服务器日志简单地统计是远远不够的;通过采用各种数据挖掘的手段对用户的访问记录(日志)进行处理加工从而发现隐含的有价值信息(知识)正是网络用途挖掘(Web Usage
Mining)的目标所在.该文在概述了数据挖掘和数据仓库等有关知识的基础上,介绍了Web挖掘的基本概念,分类和发展现状.在分析了数据预处理工作的意义后,详细分析了面对海量的用途数据,如何去粗取精,去伪存真,如何将原始的日志文件归整加工成不同挖掘粒度,即用途数据预处理的整个过程;提出了完全拟合W
3C提供的若干用途数据结构的预处理模型,并通过实验验证了算法的合理性.继而,又从数据预处理的角度,分析了聚类--这种数据挖掘功能的意义;介绍了各种适用于聚类操作的研究方法;针对由预处理阶段得到的点击流,采用寻找最长共同子序列(LCS)的方法定义了点击流之间的相似度,并由此生成了加权无向图;最后简述了如何利用图形分割技术实现点击流聚类的方法.最后总结全文的内容,并对下一步的工作做出合理预见.
【文摘语种】 中文文摘
插入表情