帮帮文库

毕业论文:Web事务聚类分析的研究与实现 毕业论文:Web事务聚类分析的研究与实现

格式:DOC | 上传时间:2022-06-24 19:06 | 页数:37 页 | ✔ 可以修改 | @ 版权投诉 | ❤ 我的浏览
毕业论文:Web事务聚类分析的研究与实现
毕业论文:Web事务聚类分析的研究与实现
1 页 / 共 37
毕业论文:Web事务聚类分析的研究与实现
毕业论文:Web事务聚类分析的研究与实现
2 页 / 共 37
毕业论文:Web事务聚类分析的研究与实现
毕业论文:Web事务聚类分析的研究与实现
3 页 / 共 37
毕业论文:Web事务聚类分析的研究与实现
毕业论文:Web事务聚类分析的研究与实现
4 页 / 共 37
毕业论文:Web事务聚类分析的研究与实现
毕业论文:Web事务聚类分析的研究与实现
5 页 / 共 37
毕业论文:Web事务聚类分析的研究与实现
毕业论文:Web事务聚类分析的研究与实现
6 页 / 共 37
毕业论文:Web事务聚类分析的研究与实现
毕业论文:Web事务聚类分析的研究与实现
7 页 / 共 37
毕业论文:Web事务聚类分析的研究与实现
毕业论文:Web事务聚类分析的研究与实现
8 页 / 共 37
毕业论文:Web事务聚类分析的研究与实现
毕业论文:Web事务聚类分析的研究与实现
9 页 / 共 37
毕业论文:Web事务聚类分析的研究与实现
毕业论文:Web事务聚类分析的研究与实现
10 页 / 共 37
毕业论文:Web事务聚类分析的研究与实现
毕业论文:Web事务聚类分析的研究与实现
11 页 / 共 37
毕业论文:Web事务聚类分析的研究与实现
毕业论文:Web事务聚类分析的研究与实现
12 页 / 共 37
毕业论文:Web事务聚类分析的研究与实现
毕业论文:Web事务聚类分析的研究与实现
13 页 / 共 37
毕业论文:Web事务聚类分析的研究与实现
毕业论文:Web事务聚类分析的研究与实现
14 页 / 共 37
毕业论文:Web事务聚类分析的研究与实现
毕业论文:Web事务聚类分析的研究与实现
15 页 / 共 37

1、对页面的内容进行挖掘二是结构挖掘,即对页面之间的结构进行挖掘三是使用信息挖掘,即对用户访问时留下的访问记录进行挖掘。本课题事务聚类分析,则属于使用信息挖掘。聚类分析是挖掘的关键技术之。在使用挖掘中,可以进行两种聚类用户聚类或用户访问事务聚类和页面聚类。个性化服务中的用户聚类主要是指通过分析服务器的日志文件获取用户的行为模式,并将其量化,然后利用定的算法进行聚类即要建立具有相似浏览模式的用户群的过程。这样的规则对于电子商务中的市场决策和向用户提供个性化的服务是非常有帮助的。页面聚类是要挖掘具有相关内容的页面簇,这对于搜索引擎和提供商都是非常有用的。本论文只关注用户聚类,并且以会话事务作为聚类分析中的数据对象。用户聚类可以用于为组特定用户建立简档。这需要抽取并选择最能描述这组特定用户的特征。

2、分析,可以获得用户群对站点的关注热点用户浏览网站的行为规律等模式知识,这些知识对于于服务个性化推荐,改善页面之间的链接结构,提高整个系统的性能,开展电子商务智能应用等方面都具有重大意义。本文结合北京电子科技学院的服务器日志,对基于会话粒度的事务聚类分析的各个阶段进行了详细的论述。本文在介绍了事务聚类分析系统的总体设计之后,首先分析了聚类分析的数据基础,并在聚类分析前对原始数据实施了有针对性的数据清洗工作。为了获得质量良好的聚类结果,除了对数据集进行有针对性的数据清洗以及采用良好的聚类算法之外,数据集本身也要满足定的要求。是清洗后得到的数据集中,用户集中访问的不同地址的个数和会话总数的比例要适当。如果该比例过小比如整个数据集中只有个地址,那么用户的行为模式可能会比较单,没有进行聚类分析的。

3、究工作打下了坚实的基础。感谢评阅评审论文和出席论文答辩会的各位专家在百忙中给予的悉心指导,参考文献缪勇匿名用户浏览路径挖掘研究与实现南京理工大学硕士学位论文,张慧颖,焦霖楠用户访问模式聚类分析在网页推荐中的应用计算机工程年月,第卷第期戴升祥蚁群算法在挖掘中的应用研究广西大学硕士学位论文,段海滨蚁群算法原理及其应用科学出版社,年何尧,赵跃龙种新的用户行为模式挖掘算法的研究计算机测量与控制潘钧面向日志的语义聚类算法计算机应用研究,年月,第卷第期潘莹,梁京章,黎慧娟基于算法的校园网用户行为聚类分析计算机技术与自动化,年月,第卷第期郭岩网络日志中用户兴趣的挖掘及利用中国科学院计算科学技术研究所博士学位论文,年金松河,钱慎,张素智基于日志的高精度聚类算法河南科技大学学报自然科学版,年月,第卷第期。

4、具有定的参考价值。下步的研究工作事务聚类分析只是使用挖掘工作的部分。本文的绪论也曾提到,在很多应用中,聚类分析作为种数据预处理过程,是进步分析和处理数据的基础。因此,在本文的基础上,还可以在下面几个方向上做进步的研究进步分析各事务簇的模式。本文根据各个事务所访问的主题将相似的事务聚集成簇,并且以簇中事务频繁访问的主题作为该簇的特征。在此基础上,还可以发现簇中事务的更多特征。比如,在关心学院新闻动态的事务中,用户更关注哪类新闻这些用户都来自什么地区他们喜欢在哪些时间上学院的网站看新闻等等。挖掘孤立点的特征。在基于蚁群算法的聚类分析中,我们发现了大量的孤立点,数量接近数据集的半。这些孤立点不能被分配到已发现的任何个簇中。虽然在基于均值算法的聚类分析中,我们发现了些蚁群聚类算法不能发现的特征。

5、类社会的产生和发展而不断深化。人类要认识世界,就必须区别不同的事物并认识事物间的相似性。聚类是个无监督的学习过程,它同分类的根本区别在于分类需要事先知道分类过程所依据的数据特征,而聚类是要找到这个数据特征。因此,在很多应用中,聚类分析作为种数据预处理过程,是进步分析和处理数据的基础。例如在商务中,聚类分析能够帮助市场分析人员从客户基本库中发现不同的客户群,并且用购买模式来刻画不同客户群的特征。在生物学中,聚类分析能用于推导植物和动物的分类,对基因进行分析,获得对种群中固有结构的认识。聚类分析也可以用于在泥土观测数据库中对相似地区的区分,也可以根据房子的类型价值和地域对个城市中的房屋进行分类。当然,就如本文所论述的,聚类分析也可以用于对事务进行分类,以获得不同用户浏览网站的行为模式。作为。

6、要如果该比例过大,那么聚类分析后可能会得到许多体积很小的簇,这样的分析结果是难以为人所理解的。二是站点的网页地址要具有良好的格式,这会使数据清洗工作更易实现,也会使聚类的结果更易为人所理解。在事务聚类阶段,本文首先采用了基于人工蚂蚁模型的聚类分析算法得到了和数据集相关的先验知识,然后在此先验知识的基础上,又采用均值算法对数据集进行了重新分析,并且对比了两个算法的优劣。试验表明,在缺乏先验知识的情况下,蚁群算法比均值算法更适合作为事务聚类分析的算法。但是为了获得更为全局的认识,或者为了发现蚁群算法不能发现的更细微的事务特征,可以根据使用蚁群算法所获得的先验知识,采用均值算法对事务集再次进行分析。以上的技术和方法对于发现用户访问北京电子科技学院站点的行为规律是行之有效的,对于研究其它站点也。

7、例如对服务器日志记录进行聚类分析,可能会发现类似这样有趣的规则在在线订购的用户中,的用户年龄在岁之间,并且家住北京海淀区。可以使用经典的聚类分析方法,包括分层算法均值算法模糊均值算法图论聚类法神经网络法以及基于统计的方法等也可以使用近几年在聚类分析领域取得了很大研究进展的仿生算法,如蚁群算法。将蚁群算法用于聚类分析,灵感源于蚂蚁堆积它们的尸体和分类它们的幼体。本文将使用均值算法和基于人工蚂蚁模型的蚁群聚类算法对给定的事务数据集进行分析,并对比两种算法在事务聚类应用上的优劣。事务聚类分析系统的总体设计开发目标本系统的开发目标旨在实现款以日志为数据源,采用使用挖掘及事务聚类分析的相关技术和算法分析用学院信息人才培养系部设置学生天地科学研究后勤服务招生信息网机构总览重要文件专题专题在这次的聚。

8、类结果中,簇的体积极其庞大,几乎覆盖了整个数据集。该簇的事务主要访问的主题是学院信息学院概况招生就业系部设置学生天地和研究生工作处,这几乎包含了网站中所有最主要的主题。可以说,这样的事务特征等于没有特征。簇簇和簇的体积虽然偏小,但是仍能作为正常的事务簇。簇和簇的事务以访问学院的新闻动态为主,但不同的是簇的事务除了关心新闻动态以外,还关心学院的概况和机构设置,可以推测这类事务的用户可能是有意报考我院的考生,或者是有意到我院就职的应聘人员而簇的事务除了访问新闻动态以外,还比较关注学院的后勤服务信息,这是在使用蚁群算法作为聚类手段时没有发现的。簇的事务以访问学院的概况和招生就业信息为主,其次是访问学院的研究生工作信息。可以推测这类事务的用户很可能是有意报考我院的考生,并且其中含有大量报考我院。

9、,而是只要达到定的事先给定的阈值就可以了。通常情况下,数据库查询只对数据库的原始字段进行,而数据挖掘则可能在数据库的不同层次上发掘知识规则。目前,数据挖掘已成为计算机科学研究中的个十分活跃的前沿领域,并在市场分析金融投资欺诈甄别医疗卫生环境保护产品制造和科学研究等许多领域有着广泛的应用,取得了十分可观的社会效益和经济效益。同时,知识发现和数据挖掘的研究和应用,为人工智能这门前沿学科的发展注入了新的活力,有力地促进了计算机科学朝着纵深方向蓬勃发展。聚类分析在数据挖掘的众多技术当中,聚类分析是数据挖掘当中的核心技术之。物以类聚,人以群分聚类,是将数据集中的数据聚集成类,使类间数据的相似性最小化,而使类内数据的相似性最大化。虽然人类对聚类的研究始于世纪年代,但是聚类是个古老的问题,它伴随着人。

10、据挖掘的功能,聚类分析可以作为个获得数据分布情况观察每个类的特征和对特定类进步分析的工具。通过聚类,人们能够识别数据集中密集和稀疏的区域,发现全局的分布模式,以及数据属性之间的相互关系等。挖掘和事务聚类分析提供了个海量信息存储和流通的平台。作为最主要的应用之,成为个巨大的分布广泛的全球性的信息服务中心,它涉及到新闻广告金融管理教育电子政务电子商务等各方面的信息服务,这为数据挖掘提供了丰富的数据源。人们希望有个工具能够自动从上,尤其是服务上提取知识。因此人们在传统数据挖掘的基础上,又提出了挖掘的概念。挖掘是数据挖掘在上的应用,它利用数据挖掘技术从与相关的资源和行为中抽取感兴趣的有用的模式和隐含信息,涉及技术数据挖掘计算机语言学信息学等多个领域,是项综合技术。该技术可以分为三类是内容挖掘,。

11、但是这些特征仍然十分模糊。这些孤立点可能隐藏了些有价值的知识。根据已有的聚类分析结果构建个性化服务推荐系统。事务聚类分析的结果可以用于构建个性化服务的推荐系统。当个用户在网站上浏览了定时间后,个性化服务系统就可以判断该用户更具备哪个用户群的特征,从而将已经为该用户群定制好的页面呈现给用户,使得用户的浏览更为便利,同时也可提高用户的访问兴趣。这种推荐系统在电子商务网站上具有巨大的应用价值。随着的迅猛发展和电子商务电子政务的兴起,使用挖掘将会得到更多的重视,也会得到更大的发展。致谢首先非常感谢老师,张老师从我的毕业设计开题起,就不断地给予我许多指导,同时他也带我走进了数据挖掘的大门。感谢和老师,他们对我的毕业设计都提供了非常有帮助的建议。感谢计算机科学与技术系全体老师的辛勤教育,他们为我的。

12、究生的考生。其余簇的体积过小,因此不能作为正常的事务簇。试验结果小结从试验结果可以看出,使用蚁群聚类算法不需要与数据集相关的先验知识,无需事先指定簇的数目,并且获得的聚类结果较为自然,能够发现各种大小的簇,且包含的细节数量适中,可以很好地被解释。但是在蚁群聚类分析的结果中,可能存在着大量的孤立点,这些孤立点可能含有细微但是重要的特征。均值聚类算法需要知道数据集中簇的数目这先验知识。由于该算法不考虑孤立点的存在,因此可能会将大量相似度较低的数据对象聚集到个簇中,最终形成体积庞大并且特征模糊的簇。另外,由于均值算法含有较多的随机因素,因此其聚类结果不稳定。但是使用均值算法有可能发现蚁群算法聚类中不能发现的孤立点的特征。总结与展望论文总结事务聚类分析是挖掘领域的重要内容,通过对用户事务进行聚。

参考资料:

[1]毕业论文:PLC在谷物烘干机自动控制中应用(第66页,发表于2022-06-24 19:18)

[2]毕业论文:PLC在自动洗衣机上的应用论文(第34页,发表于2022-06-24 19:18)

[3]毕业论文:PlC在磨床自动化改造中的应用(第45页,发表于2022-06-24 19:18)

[4]毕业论文:PLC在电镀生产线上的应用(第37页,发表于2022-06-24 19:18)

[5]毕业论文:PLC在电梯电气控制中的应用(第46页,发表于2022-06-24 19:18)

[6]毕业论文:PLC在污水处理厂中控制系统设计—双恒压供水系统的程序设计(第24页,发表于2022-06-24 19:18)

[7]毕业论文:PLC在机械手控制设计(第33页,发表于2022-06-24 19:18)

[8]毕业论文:PLC在无功补偿自动补偿控制中应用(第20页,发表于2022-06-24 19:18)

[9]毕业论文:PLC在数控机床上的应用(第26页,发表于2022-06-24 19:18)

[10]毕业论文:PLC在恒压供水系统中的应用(第39页,发表于2022-06-24 19:18)

[11]毕业论文:PLC在工业自动化中的应用及发展(第24页,发表于2022-06-24 19:18)

[12]毕业论文:PLC在太阳能清洗机上的控制(第37页,发表于2022-06-24 19:18)

[13]毕业论文:PLC在十字路口交通灯控制系统中的应用毕业设计(第28页,发表于2022-06-24 19:18)

[14]毕业论文:PLC在全自动洗衣机控制系统中的应用(第43页,发表于2022-06-24 19:18)

[15]毕业论文:PLC和变频器的氧枪升降系统中的应用(第32页,发表于2022-06-24 19:18)

[16]毕业论文:PLC和变频器在中央空调节能改造中的应用(第43页,发表于2022-06-24 19:18)

[17]毕业论文:PLC升降电梯驱动系统设计及控制电路设计(第61页,发表于2022-06-24 19:18)

[18]毕业论文:plc十字路口交通灯设计(毕业设计)(第40页,发表于2022-06-24 19:18)

[19]毕业论文:PLC功能图编程在交通信号灯控制中的应用(第42页,发表于2022-06-24 19:18)

[20]毕业论文:PLC供水系统设计李林(第22页,发表于2022-06-24 19:18)

下一篇
温馨提示

1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。

2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。

3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。

4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。

5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。

帮帮文库——12年耕耘,汇集海量精品文档,旨在将用户工作效率提升到极致