更好的应用在实际生活上。因此,从这此实验我们得到的结论是尽量选择数据最开始的连续的点作为初始点,这样可以用最少的迭代次数完成聚类改变均值算法的初始点可以影响数据集的迭代次数,对聚类结果影响不大每次初始值的改变也会造成数据输出顺序的改变,即使是在聚类结果不变的情况下。实验二本次试验是验证不同的数据输入顺序,对聚类结果的影响,实验的数据集为了更具说服力,还是用实验中的数据,不同之处是,此次实验只是将数据集中的后个数放到前面,也就是与前个数调换下顺序,本次试验只是验证数据集输入顺序的改变对聚类结果的影响,所以只选取两种初始值进行验证,与实验进行对比,可得实验结果如下令前三个数据作为初始聚类中心,如图所示图数据输入顺序改变聚类图把第个数据作为初始聚类中心,得到的聚类结果如图所示图数据输入顺序改变聚类图实验分析与结论分析本次实验主要是与之前的数据顺序不同时所得的聚类结果,由图与图,图与图的对比结果可得出,改变了数据的输入顺序,造成聚类结果有很大的改变,同时迭代次数也增加了,这说明均值算法对数据输入顺序的敏感性不仅体现在迭代次数上,而且更会改变数据的迭代次数。另外,再对比图与图的结果,虽然两次的聚类结果是样的,但是迭代的次数当选取第个数据为初始点比选取第个数据为初始点迭代次数有所增加,聚类结果的输出顺序也有所改变,同时也验证了实验的结论。结论由实验可得均值算法对数据集的输入顺序也是敏感的,不同的的顺序会有不同的聚类结果,这也是今后改进算法可以尝试的方向,也可以在应用该算法时,通过改变数据集的输入顺序来适当提高聚类效果。本次试验改变了输入顺序反而使迭代次数增加,很可能再次改变输入顺序会让迭代次数减少,这些都说明均值算法对数据输入顺序特别敏感,因此我们得到的结论是当我们聚类数据集迭代次数很多时,我们可以适当改变下数据的输入顺序均值算法的聚类结果对数据输入顺序很敏感,与之前没有改变顺序之前的聚类结果差距很明显,所以不要轻易变动数据集的输入顺序本章小结本章主要是实现均值算法,并且在实现该算法的基础上,对影响均值聚类效果的两方面因素初始点的选择和数据输入顺序两个方面的因素对聚类结果的影响情况进行验证。通过两个实验,实验有个运行结果,实验二有个运行结果,比较充分的验证了这两方面的因素对聚类结果的影响,并通过对比试验结果,得到结论初始点选取的不同会影响数据集的迭代次数,不会特别明显的影响聚类结果,而不同的数据输入顺序,会对聚类结果造成明显的影响,同时也会改变迭代次数,这些结论为用户在将来使用传统均值算法的时候提供些降低因均值算法的缺陷带来的损失和避免造成不必要麻烦的建议。总结与展望总结本文主要介绍了数据挖掘中的聚类分析,对聚类分析中的均值算法进行了探索研究,主要是对影响均值算法的聚类效率因素的探究。首先,介绍了本文的研究背景与本文的研究意义,简单介绍了数据挖掘的背景,着重介绍了聚类分析目前研究的国内外成本元单位成本元吨总成本元计划编制档案管理订单处理打印派车单回访车辆信息收集运费现状,主要是对聚类分析的应用领域与研究方向进行了探讨,并分析了目前聚类分析还有哪些亟待解决的问题。其次,对数据挖掘中聚类分析进行了系统与完整的分析,主要是对聚类的定义及表示聚类的相似测量函数距离测量函数和聚类的五个常用算法的介绍,着重研究划分聚类算法。最后,对基于划分的聚类算法中的均值算法进行了探究,在详细的介绍了均值算法的定义基本思想算法流程等方面对该算法进行了分析,并对该算法的特点进行研究,分析了它的长处和不足,并根据该算法本身存在的问题,对应该算法自身不足的因素进行了探究与实验,经过实验表明,初始值的选取不当和数据输入顺序的改变都会影响聚类结果,但是初始值的改变对聚类结果的影响不明显,对于不同的初始值会有不同的迭代次数,而数据输入顺序的改变,对聚类结果造成的影响很大。因此我们在实际应用中应该注意这方面的不同因素,会对聚类结果造成哪些影响,通过本次试验,也可以为希望出现的聚类结果提供改进算法的思考方向,使该算法能够更好的为我们服务。展望通过实验证明的结论并未对更多的数据集进行验证,还不能验证出更多的影响均值聚类算法的因素对聚类结果会造成怎样的影响,这部分工作应该进步深入下去,可以通过对更大更多类型的数据集验证其他不同因素改变所得结果进行比较,来得出各个因素影响均值算法的聚类结果的哪些方面,得出均值算法最敏感的初始条件,比较出哪些条件在实际应用中最容易得到优化,这样就会使得之前提出的改进的均值算法得到优化,更好的有的放矢,为将来该算法和该算法的改进后的算法更加灵活的应用到现实的生活中去。目前已经存在了很多中改进的算法,以后的工作是我们应该对多种算法通过相同的数据集进行全方位的对比,通过对比得出的结果往往更加明确,从而分析出各个算法的因各个因素的不同受影响的范围与程度,并将这些结论利用大量的数据集进行验证,来作为每个新的算法使用帮助,有助于用户对大量算法的选择起个指导性的作用,更加方便我们使用。当然没有种算法是完美无缺的,再优秀的算法设计也会有它不能很好聚类的数据领域,这就要我们在实际应用中,扎实我们自身的算法知识的积累,要灵活的选取不同的算法为我们服务,不要拘泥于过分复杂算法,有的时候简单的算法也有它的自身优势,比如本文介绍的均值算法,总之,知识不但要积累,还要灵活使用,才能发挥科学最大的力量。参考文献,,邵峰晶,于忠清,王金龙,孙仁城数据挖掘原理与算法第二版北京科学出版社张建辉聚类算法研究及应用武汉理工大学硕士学位论文武汉武汉理工大学,冯超类算法的研究大连理工大学硕士学位论文大连大连理工大学,曾志雄种有效的基于划分和层次的混合聚类算法计算机应用范光平种基于变长编码的遗传均值算法研究浙江大学硕士学位论文杭州浙江大学,孙士保,秦克云改进的平均聚类算法研究计算机工程孙可,刘杰,王学颖均值聚类算法初始质心选择的改进沈阳师范大学学报,,,,,,表佳祥物流企业各服务对象的成本汇总续作业实际耗用资源价值亚西利君单位成本元吨总用最少的时间完成我们所需要的结果为我们分析装设隔离开关。配电装置的型号为型金属铠装移开式高压开关柜。型金属铠装移开式高压开关柜,由柜体和手车两大部分组成。柜体的外壳及各功能单元的隔板均采用钢板弯制螺纹紧固件联接而成。手车的面板为开关柜的面板,当手车在运行位置时其外壳防护等级为,当手车在试验位置时防护等级为。开关柜用金属薄板分隔为手车室母线室馈电室。各室均有压力释放通道,环氧树脂浇注的触头座是手车室与母线室馈电室的联络媒介,保证手车在运行状态时三室隔离防护等级为。手车室与母线馈电室两室间设置有金属隔离活门,手车推入时活门自动开启,手车退出时关闭并闭锁。继电器箱为独立箱体,室内右操作走廊,维护走廊,总长宽。其它围墙设置实体围墙。高度,所内道宽采用水泥混凝土路面,道路转变半径为,变压器储油坑距变压器,补偿电容器室电容器双层布置,面积,主控室面积,主控室布置在配电装置旁边,是有利于观察及屋内配电装置。小结配电装置是变电站的重要组成部分,是根据电气主接线的连接方式,由开关电器保护及测量电器母线和必要的辅助设备组建而成的,用来接受和分配电能的装置。配电装置可分为屋内配电装置屋外配电装置和成套配电装置。屋内配电装置主要用于及以下,有特殊要求时,也可采用屋外配电装置主要用于及以上成套配电装置目前主要用于屋内,全封闭组合电器主要用于配电装置。结论本人对电力系统的基本知识以及相关课程有了更深步的了解,在此基础上进行本次毕业设计。通过专业学习和老师的悉心教导,再结合自己的实际工作,使自己的专业技术水平得到了提高。本次电力系统的专业知识学习,使我系统地了解了电力系统变电站的各种设备。比如变电站的主接线原理,各种接线方式的优缺点,怎样选择主接线选择什么样的主接线既节省投资又能满足供电可靠性和负荷的要求。通过本次对降压变电站电气部分的改造设计,使我对变电站以及电力系统的结构操作运行有了更深步的了解,同时也是个把自己所学专业知识得以施展验证的机会,从中找出自己的不足,也使自己的专业知识得以巩固。在本次设计过程中,我查阅了大量有关电力系统变电站的信息资料,了解了许多先进电力设备的性能,对今后的工作有很大的帮助。本设计还存在不足之处,首先,本次的设计的是个变和的降压变电站,主要涉及的变电站内部电气部分的设计,其中并未涉及到出线线路具体应用到什么用户,所以负荷统计表相对比较简洁,也减少了电气主接线图的制作难度。另外,由于本专业对继电保护知识学习的还不够全面,加上继电保护涉及的内容很多,所以没有对变电站继电保护作更深的设计分析。由于本人水平有限,设计中难免有和疏漏的地方敬请各位老师批评指正。参考文献刘维仲中小型变电站电气设备的原理与运行,科学出版社,何仰赞,温增银电力系统分析上武汉华中科技大学出版社,何仰赞,温增银电力系统分析下武汉华中科技大学出版社,范锡普发电厂电气部分北京中国电力出版社,曹绳敏电力系统课程设计及毕业设计参考资料北京水利电力出版社,陈跃电力工程专业毕业设计指南北京中国水利水电出版社,李玉盛,马良玉,牟道槐发电厂更好的应用在实际生活上。因此,从这此实验我们得到的结论是尽量选择数据最开始的连续的点作为初始点,这样可以用最少的迭代次数完成聚类改变均值算法的初始点可以影响数据集的迭代次数,对聚类结果影响不大每次初始值的改变也会造成数据输出顺序的改变,即使是在聚类结果不变的情况下。实验二本次试验是验证不同的数据输入顺序,对聚类结果的影响,实验的数据集为了更具说服力,还是用实验中的数据,不同之处是,此次实验只是将数据集中的后个数放到前面,也就是与前个数调换下顺序,本次试验只是验证数据集输入顺序的改变对聚类结果的影响,所以只选取两种初始值进行验证,与实验进行对比,可得实验结果如下令前三个数据作为初始聚类中心,如图所示图数据输入顺序改变聚类图把第个数据作为初始聚类中心,得到的聚类结果如图所示图数据输入顺序改变聚类图实验分析与结论分析本次实验主要是与之前的数据顺序不同时所得的聚类结果,由图与图,图与图的对比结果可得出,改变了数据的输入顺序,造成聚类结果有很大的改变,同时迭代次数也增加了,这说明均值算法对数据输入顺序的敏感性不仅体现在迭代次数上,而且更会改变数据的迭代次数。另外,再对比图与图的结果,虽然两次的聚类结果是样的,但是迭代的次数当选取第个数据为初始点比选取第个数据为初始点迭代次数有所增加,聚类结果的输出顺序也有所改变,同时也验证了实验的结论。结论由实验可得均值算法对数据集的输入顺序也是敏感的,不同的的顺序会有不同的聚类结果,这也是今后改进算法可以尝试的方向,也可以在应用该算法时,通过改变数据集的输入顺序来适当提高聚类效果。本次试验改变了输入顺序反而使迭代次数增加,很可能再次改变输入顺序会让迭代次数减少,这些都说明均值算法对数据输入顺序特别敏感,因此我们得到的结论是当我们聚类数据集迭代次数很多时,我们可以适当改变下数据的输入顺序均值算法的聚类结果对数据输入顺序很敏感,与之前没有改变顺序之前的聚类结果差距很明显,所以不要轻易变动数据集的输入顺序本章小结本章主要是实现均值算法,并且在实现该算法的基础上,对影响均值聚类效果的两方面因素初始点的选择和数据输入顺序两个方面的因素对聚类结果的影响情况进行验证。通过两个实验,实验有个运行结果,实验二有个运行结果,比较充分的验证了这两方面的因素对聚类结果的影响,并通过对比试验结果,得到结论初始点选取的不同会影响数据集的迭代次数,不会特别明显的影响聚类结果,而不同的数据输入顺序,会对聚类结果造成明显的影响,同时也会改变迭代次数,这些结论为用户在将来使用传统均值算法的时候提供些降低因均值算法的缺陷带来的损失和避免造成不必要麻烦的建议。总结与展望总结本文主要介绍了数据挖掘中的聚类分析,对聚类分析中的均值算法进行了探索研究,主要是对影响均值算法的聚类效率因素的探究。首先,介绍了本文的研究背景与本文的研究意义,简单介绍了数据挖掘的背景,着重介绍了聚类分析目前研究的国内外成本元单位成本元吨总成本元计划编制档案管理订单处理打印派车单回访车辆信息收集运费
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
第 1 页 / 共 45 页
第 2 页 / 共 45 页
第 3 页 / 共 45 页
第 4 页 / 共 45 页
第 5 页 / 共 45 页
第 6 页 / 共 45 页
第 7 页 / 共 45 页
第 8 页 / 共 45 页
第 9 页 / 共 45 页
第 10 页 / 共 45 页
第 11 页 / 共 45 页
第 12 页 / 共 45 页
第 13 页 / 共 45 页
第 14 页 / 共 45 页
第 15 页 / 共 45 页
预览结束,还剩
30 页未读
阅读全文需用电脑访问
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。
1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。