种意义上来讲,本研究可以说是对交往数据集知识发现种解决方案,或者,是项力图使交往数据分析通用化探索。从结构上,本文共分为五章。第章介绍了本文研究背景国内外研究现状以及本文组织结构。第二章介绍了与本文研究内容紧密相关理论知识,包括社会网络分析基本概念社会网络分析中心性指标集凝聚子群分析概念数据仓库以及多维分析等。第三章对原型系统设计进行了总体介绍。第四章着重讲述原型系统中四个主要模块设计与实现,从设计到最终实验进行了详细阐述。第五章将对本文研究结论进行总结,分析目前存在缺陷,提出后续研究内容和方向。盐塞銮适去堂亟堂焦监塞担羞堡论翅迟相关理论知识本章着重介绍研究课题相关理论知识,主要阐述社会网络分析基本概念中心性指标集以及凝聚子群分析等内容,另外,筒单介绍了研究中所涉及到数据仓库多维分析相关概念。社会网络分析基本概念社会网络是指社会行动者及其之问热情帮助,在此向他们表达我感激之情。另外也感谢深爱我家人,他们理解和支持使我能够在学校专心完成我学业。韭塞窑垄盍堂亟堂焦盈塞崖序参与社会网络分析课题研究也有将近半年时间,从最初理论知识学习组内讨论会开发原始实验平台暑假集中开发原型系统到今天毕业论文,我深刻体会到了项科学研究不易,它不但需要扎实理论基础和严谨科学态度,更需要种把握准确方向魄力。在整个研究过程中,我们研究曾经度陷入迷茫,毕竟社会网络分析是从我们不熟知社会学中发展而来,其使用者也主要是社会学家,如何将其引入到我们熟知领域并合理使用是课题组每个人都冥思苦想过问题。思考结果是取其精华,结合本学科理论,进行原型系统开发。在开发过程中,我们又以工程项目标准严格要求自己,大到界面小到个算法实现,都尽力做到精益求精。于是,今天才有这样个初具雏形系统,也才能有充足素材完成我毕业论文。些立窑适盍堂亟堂焦逾塞直引言通信技术和互联网技术发展引发了新网络生活形态,越来越多虚拟社会呈现在人们面前,比如电话通信形成入际关系网互联网上形成虚拟社区等,透过这些网络所展现出社会关系和人际互动是许多研究关注焦点。然而,虚拟社会研究与现实社会研究存在着极大不同,现实社会可以对诸多鲜活个体进行调查研究,而对虚拟社会探索,只能着眼于数据,即业务系统或应用系统积累交往数据集。面对庞大复杂数据集,如何进行有效分析与数据挖掘昵社会网络分析是目前数据挖掘中与社会生活联系最紧密熟点之,它是从社会学领域延伸而来,如今正与其它学科相互渗透并高速发展,目前已经在客户关系管理犯罪网络挖掘等方面取得了很好应用效果。研究背景社会网络分析发源于世纪年代英国人类学研究。英国人类学家布朗在对社会结构关注中,首次使用了“社会网络”概念。在接下来多年,通过多个学科领域几代学者共同努力,终于使得社会网络分析成为种比较成熟社会科学研究范式,出现了比较成熟完善概念体系,诸如“中心度”“中心势”“派系”等,同时,也涌现了许多网络分析技术,社会网络分析正式进入了社会学研究主流,并对其他学科也产生越来越大影响,对数据挖掘领域影响也正在与日俱增。纵观社会网络分析发展简史,其主要发展脉络如图所示。这个学派主要有如下三个传统社会计量学者,他们通过研究小群体,在技术上从很多方面推进了图论方法发展年代哈佛学者,他们研究了入际关系模式,提出了“派系”这个概念曼彻斯特人类学家,他们在前两种传统基础上考察了部落和乡村“社区”关系结构这些传统最终于年代和年代在哈佛大学又次汇聚在起,当代社会网络分析正是在那个时代出炉于哈佛。从数据挖掘角度来说,社会网络分析也被称为链接挖掘。在这个领域当中,人们更多研究了非现实社会实例,比如电力网络电信交互网络邮件交换网络链接网络以及文献索引网络等等,应用点大多着重于相似个体识别小团体识别权威判断等。格式塔理论结构功能人类学八田野理论社会计量学沃纳,梅奥格卢克曼群体力学堡土塑巴恩斯,特,纳德尔群体动力学二二二二二二二二二二!巴恩斯,博特,纳德尔心哈佛结构主义者图论米切尔社会网络分析图社会网络分析发展系谱图国内外研究现状近几年,国外很多研究学者致力于社会网络分析研究与应用,目前,社会网络分析己广泛应用于分析国家贸易关系社会人物关系发现和理解社会结构研究组织通信行为。自从恐怖袭击事件之后,国际社会对于犯罪网络研究更加关注,而社会网络分析也被很好应用于此,如和等人设计了个犯罪网络知识发现体系,能够帮助执法机关高效准确发现犯罪网络知识,并将其结构可视化。社会网络分析也广泛用于邮件挖掘,如等人通过分析邮件通信流,挖掘相关邮件主体,获取个人相关信息,为执法机关侦查和分析提供决策支持。另外,社会网络分析在页面排序方面也有所应用,如所采用算法,就是基于页面链接到页面通常表明对认可度。在国内研究中,社会网络分析最早由社会学和心理学领域引入,尤其是对计算机网络支持社会网络研究。近两年,针对社会网络分析研究逐渐增多。唐常杰等人基于社会网络分析方法,在虚拟社团结构挖掘基于六度分割和最短路径社团核心成员挖掘以及基于用户属性通信行为挖掘三个方面进行了探索性研究。李玮等人将社会网络分析技术引入信息安全领域,提出种基于社会网络分析内容安全动态监测模型,。随着互联网进入时代,网络应用从信息内容互联发展到“人”社韭塞銮逼塞堂亟堂僮迨塞宣会互联,涌现了大量社会网络。比较著名有国外和等,国内和,人们也正对此进行社会网络分析应用方面研究与探索。研究内容和结构针对业务和应用系统产生交往数据集,如电话通信记录等,本研究以挖掘可用信息应用为出发点,以社会网络分析方法为理论指导,以数据分析模型架构为主线,探索并设计了交往数据集知识发现系统框架,力争将抽象业务数据以形象化展示和精确分析结果呈现在用户面前。从种意义上来讲,本研究可以说是对交往数据集知识发现种解决方案,或者,是项力图使交往数据分析通用化探索。从结构上,本文共分为五章。第章介绍了本文研究背景国内外研究现状以及本文组织结构。第二章介绍了与本文研究内容紧密相关理论知识,包括社会网络分析基本概念社会网络分析中心性指标集凝聚子群分析概念数据仓库以及多维分析等。第三章对原型系统设计进行了总体介绍。第四章着重讲述原型系统中四个主要模块设计与实现,从设计到最终实验进行了详细阐述。第五章将对本文研究结论进行总结,分析目前存在缺陷,提出后续研究内容和方向。盐塞銮适去堂亟堂焦监塞担羞堡论翅迟相关理论知识本章着重介绍研究课题相关理论知识,主要阐述社会网络分析基本概念中心性指标集以及凝聚子群分析等内容,另外,筒单介绍了研究中所涉及到数据仓库多维分析相关概念。社会网络分析基本概念社会网络是指社会行动者及其之问局就是最接近所定美学标准布局方案。图遗传进化图叩对于个节点图,称第个节点在平面坐标,为个体第个“基因”,基因作为原子单位,最终决定图布局将个由胛个实数构成串妇锄,弦称为个“个体”,个体为遗传算法基本单位,进行杂交变异行为设定种群规模为,则由个不同个体组成集合称为个种群,按遗传算法思想,荦孛群将从个随机初始状态在自然法则评价函数作用下,不断进化成最适应种群,这个时候我们可认为当前种群中最优个体即为最佳方案,故可按照其基因构造去实现布局。算法流程如图所示评价函数模拟自然法则对遗传算法起着至关重要意义。首先,它作为遗传算法核心。对算法进行起驱动作用其次,其评价功能指引种群向着理想方拙塞室道盘堂硒堂鱼论塞四仝主要搓基鳆瑾绁途让皇塞现向进化同时,它作为现实要求和虚拟实现之间桥梁,能够以函数形式反映具体准则。因此,必须根据美学准则对评价函数进行建模,才能用遗传算法完成图布局。通过实验,对完全四边形八边形经过遗传算法布局效果图如图,与图禾所示够圆图完全四边形遗传算法布局效果图鱼眼图图完全八边形遗传算法布局效果图鱼眼图在展示大规模图时既能体现关注节点局部细节,也能对全局结构有个较好反映。鱼眼图基本思想是在图完成初始布局后,通过对点位置和大小重新布局,从而使被关注点突出显示。鱼眼图布局原理归根到底是对点在图中位置重排,大小重调个过程。而决定点在鱼眼图位置主要因素有以下几种,在普通视图中位置纠在普通视图中与关注点距离三,锣,与关注点关系汐因此,点在鱼眼图中新位置砂用疠炉矗彻少决定点,在鱼眼图中大小因素有在普通视图中与关注点距离叨在普通视图中大小研砂重要性因此,点在鱼眼图中大小夕尼彻,口砂经过鱼眼图算法布局图如图所示韭立变通太堂塑堂焦逢塞四全圭墓攥拯鲍谨细遮进皇塞丑图鱼眼图布局韭塞銮盈塞堂亟堂焦途塞望绪总结论文工作总结本文探讨并实现了种基于社会网络分析交往数据集知识发现体系框架,创新之处有如下几点在数据预处理方面,通过对原始业务数据进行多维角度汇总。归化为易于处理分析数据,有效地提高了数据分析效率。在数据源获取数据方面,运用设计模式中工厂模式封装了不同类型关系数据库操作,由于该模式普适性,有利于扩展添加其它数据库或者其它格式数据源如数据等。采用数据本地化机制,以格式将待分析已经分析数据存于文件系统之中,既可以降低了原型系统与数据源之间耦合度,又可以有利于数据传输再加工和再利用。在本地模型中,通过分层,从社会组织图三个不同层次进行分析,有利于发现更多有用信息。社会层面分析有利于发现不同组织之间联系。组织之间分析有利于发现群指定个体在不同维值下不同表现。图层面分析,则可以深入到维值下群个体之闻联系。在数据可视化方面,实现了力学模型遗传算法和鱼眼图布局,使得分析结果更加形象化展现在用户面前。由于本原型系统设计是面向各种各样交往数据集,因此,在结构功能算法设计方面均考虑到了通用性,预留了扩展接口,为后续研究打下基础。由于社会网络分析应用尚处于探讨研究阶段,本文提出原型系统框架也只是个试验性尝试,目前工作尚存在着以下不足。对社会网络分析理解尚不够深刻,虽然掌握了它基本概念和和些基本分析方法,但它毕竟是个独立学科。因此,对社会网络分析理解深度,在种程度上决定了是否可以成功并灵活应用于分析数据。由于本实验基础是模拟通信记录集,数据量不够大,尽管能在定程度上看到分析效果,能够反映些现实情况,但是,如果以真实数据进行实验,得到验证将更加具有权威性。韭夏窑塑太雯亟堂焦金塞盟结,下步工作将社会网络分析方法应用于交往数据集知识发现,是种全新研究尝试。由于大规模交往数据集覆盖面广几乎覆盖了所有社会对象信息丰富,所以这些数据集知识发现工作是有意义。社会网络分析作为门独立学科,在国内外研究中已经取得了丰硕成果,并且已经成功运用于互联网等社会网络分析研究之中,所以将其应用于其它虚拟网络环境中也应该是可行。本文研究表明,将社会网络分析方法应用于般交往数据集进行知识发现,是种合理有前景研究方向。在未来研究过程中,我们应该致力于对第节中所描述个不足之处进行更深入细致研究。由于本实验室在做搜索引擎方面研究工作,接下来课题研究将对搜索链接数据进行分析,寻求社会网络分析在网页挖掘方面应用点。另外,中网络最近比较盛行,如果有可能话,可以将课题研究结合网络应用,如校
1、该PPT不包含附件(如视频、讲稿),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。