更好的应用在实际生活上。因此,从这此实验我们得到的结论是尽量选择数据最开始的连续的点作为初始点,这样可以用最少的迭代次数完成聚类改变均值算法的初始点可以影响数据集的迭代次数,对聚类结果影响不大每次初始值的改变也会造成数据输出顺序的改变,即使是在聚类结果不变的情况下。实验二本次试验是验证不同的数据输入顺序,对聚类结果的影响,实验的数据集为了更具说服力,还是用实验中的数据,不同之处是,此次实验只是将数据集中的后个数放到前面,也就是与前个数调换下顺序,本次试验只是验证数据集输入顺序的改变对聚类结果的影响,所以只选取两种初始值进行验证,与实验进行对比,可得实验结果如下令前三个数据作为初始聚类中心,如图所示图数据输入顺序改变聚类图把第个数据作为初始聚类中心,得到的聚类结果如图所示图数据输入顺序改变聚类图实验分析与结论分析本次实验主要是与之前的数据顺序不同时所得的聚类结果,由图与图,图与图的对比结果可得出,改变了数据的输入顺序,造成聚类结果有很大的改变,同时迭代次数也增加了,这说明均值算法对数据输入顺序的敏感性不仅体现在迭代次数上,而且更会改变数据的迭代次数。另外,再对比图与图的结果,虽然两次的聚类结果是样的,但是迭代的次数当选取第个数据为初始点比选取第个数据为初始点迭代次数有所增加,聚类结果的输出顺序也有所改变,同时也验证了实验的结论。结论由实验可得均值算法对数据集的输入顺序也是敏感的,不同的的顺序会有不同的聚类结果,这也是今后改进算法可以尝试的方向,也可以在应用该算法时,通过改变数据集的输入顺序来适当提高聚类效果。本次试验改变了输入顺序反而使迭代次数增加,很可能再次改变输入顺序会让迭代次数减少,这些都说明均值算法对数据输入顺序特别敏感,因此我们得到的结论是当我们聚类数据集迭代次数很多时,我们可以适当改变下数据的输入顺序均值算法的聚类结果对数据输入顺序很敏感,与之前没有改变顺序之前的聚类结果差距很明显,所以不要轻易变动数据集的输入顺序本章小结本章主要是实现均值算法,并且在实现该算法的基础上,对影响均值聚类效果的两方面因素初始点的选择和数据输入顺序两个方面的因素对聚类结果的影响情况进行验证。通过两个实验,实验有个运行结果,实验二有个运行结果,比较充分的验证了这两方面的因素对聚类结果的影响,并通过对比试验结果,得到结论初始点选取的不同会影响数据集的迭代次数,不会特别明显的影响聚类结果,而不同的数据输入顺序,会对聚类结果造成明显的影响,同时也会改变迭代次数,这些结论为用户在将来使用传统均值算法的时候提供些降低因均值算法的缺陷带来的损失和避免造成不必要麻烦的建议。总结与展望总结本文主要介绍了数据挖掘中的聚类分析,对聚类分析中的均值算法进行了探索研究,主要是对影响均值算法的聚类效率因素的探究。首先,介绍了本文的研究背景与本文的研究意义,简单介绍了数据挖掘的背景,着重介绍了聚类分析目前研究的国内外成本元单位成本元吨总成本元计划编制档案管理订单处理打印派车单回访车辆信息收集运费现状,主要是对聚类分析的应用领域与研究方向进行了探讨,并分析了目前聚类分析还有哪些亟待解决的问题。其次,对数据挖掘中聚类分析进行了系统与完整的分析,主要是对聚类的定义及表示聚类的相似测量函数距离测量函数和聚类的五个常用算法的介绍,着重研究划分聚类算法。最后,对基于划分的聚类算法中的均值算法进行了探究,在详细的介绍了均值算法的定义基本思想算法流程等方面对该算法进行了分析,并对该算法的特点进行研究,分析了它的长处和不足,并根据该算法本身存在的问题,对应该算法自身不足的因素进行了探究与实验,经过实验表明,初始值的选取不当和数据输入顺序的改变都会影响聚类结果,但是初始值的改变对聚类结果的影响不明显,对于不同的初始值会有不同的迭代次数,而数据输入顺序的改变,对聚类结果造成的影响很大。因此我们在实际应用中应该注意这方面的不同因素,会对聚类结果造成哪些影响,通过本次试验,也可以为希望出现的聚类结果提供改进算法的思考方向,使该算法能够更好的为我们服务。展望通过实验证明的结论并未对更多的数据集进行验证,还不能验证出更多的影响均值聚类算法的因素对聚类结果会造成怎样的影响,这部分工作应该进步深入下去,可以通过对更大更多类型的数据集验证其他不同因素改变所得结果进行比较,来得出各个因素影响均值算法的聚类结果的哪些方面,得出均值算法最敏感的初始条件,比较出哪些条件在实际应用中最容易得到优化,这样就会使得之前提出的改进的均值算法得到优化,更好的有的放矢,为将来该算法和该算法的改进后的算法更加灵活的应用到现实的生活中去。目前已经存在了很多中改进的算法,以后的工作是我们应该对多种算法通过相同的数据集进行全方位的对比,通过对比得出的结果往往更加明确,从而分析出各个算法的因各个因素的不同受影响的范围与程度,并将这些结论利用大量的数据集进行验证,来作为每个新的算法使用帮助,有助于用户对大量算法的选择起个指导性的作用,更加方便我们使用。当然没有种算法是完美无缺的,再优秀的算法设计也会有它不能很好聚类的数据领域,这就要我们在实际应用中,扎实我们自身的算法知识的积累,要灵活的选取不同的算法为我们服务,不要拘泥于过分复杂算法,有的时候简单的算法也有它的自身优势,比如本文介绍的均值算法,总之,知识不但要积累,还要灵活使用,才能发挥科学最大的力量。参考文献,,邵峰晶,于忠清,王金龙,孙仁城数据挖掘原理与算法第二版北京科学出版社张建辉聚类算法研究及应用武汉理工大学硕士学位论文武汉武汉理工大学,冯超类算法的研究大连理工大学硕士学位论文大连大连理工大学,曾志雄种有效的基于划分和层次的混合聚类算法计算机应用范光平种基于变长编码的遗传均值算法研究浙江大学硕士学位论文杭州浙江大学,孙士保,秦克云改进的平均聚类算法研究计算机工程孙可,刘杰,王学颖均值聚类算法初始质心选择的改进沈阳师范大学学报,,,,,,表佳祥物流企业各服务对象的成本汇总续作业实际耗用资源价值亚西利君单位成本元吨总用最少的时间完成我们所需要的结果为我们分析及生物活性有机化学Ⅱ,Ⅱ,Ⅱ,ⅡⅡ金传明,龚楚儒,杨明华新显色剂,二硝基苯噻唑三氮烯的合成及与汞的显色反应研究分析实验室致谢致谢本论文是在导师张小林教授的悉心指导下完成的。在实验的进行过程中,张教授渊博的学识严谨的治学态度科学的研究方法以及认真负责的工作态度,不仅帮助我顺利的完成实验内容,更加使我受益终生。在此衷心感谢张教授对我的关心和指导,我将时刻谨记您的教导,在今后的工作中不断努力。同时也要非常感谢李海峰师兄和朱礼良师兄从实验开始到最后结束的全部过程中,给予我的耐心的帮助,在此向两位学长表示衷心的谢意。最后,感谢父母及家人对于我学业的支持,他们无私的爱和关怀是我前进的动力。谨以此文献于他们,等以卤代酮为原料,在负载催化剂第章文献综述作用下,合成了系列的噻唑类化合物。为了方便它与其它基团的连接,苯并噻唑衍生物分子中可以引入巯基,在些文献中,已经报道了在苯并噻唑环中引入巯基的例子,年等以苄基溴,二酮为原料,在负载试剂作用下用锅法合成了氨基噻唑类化合物。硫代酰胺分子内成环法年等报道了在碱性溶液铁氰化钾作用下硫代酰胺分子内成环,合成了取代的苯并噻唑衍生物年通过类似方法合成了噻唑类化合物。年等以邻位有卤原子的硫代酰胺为原料,在紫外光照射下合成了系列的苯并噻唑类化合物。苯氨基硫脲在溴或二氯亚砜作用下也可以分子内关环。噻唑啉合成法在氨和醛的作用下硫基乙醛的二聚体合成烷基噻唑啉,该噻唑啉化合物脱氢转化成取代噻唑,如异丁基噻唑的合成。硫基酰胺的直接环合即生成噻唑啉,进步脱氢就形成了噻唑化合物。第章文献综述年利用二羰基化合物和劳森试剂或硫脲进行合环。噻唑类化合物的研究前景噻唑类杀菌剂的研究十几年的发展是个热点,将噻唑集团引入到具有不同化合物的结构中,通过结构的修饰和优化,能够产生许多具有广谱生物活性的化合物由于噻唑类化合物生物活性,环境相溶性和结构变化的多样性,使得他在新型超高杀菌剂的创制中受到越来越多的关注,并展示了良好的发展前景。噻唑类农药经过三十多年的发展,至目前已开发出多种高效安全的杀虫剂除草剂和抗病毒剂。在绿色农药的研究中,噻唑类化合物因其优良的生物活性对哺乳动物的低毒性和结构变化的多样性而受到广泛的关注,故噻唑类农药得创制和开发全新结构具有广阔的发展前景。噻唑化合物及具有结构简单和广谱生物活性等特点的类似物在药物和农药创制中占有非常重要的地位,早期的药物研究就发现在苯并噻唑类化合物的芳环或杂环中引入些简单的取代基可以获得些药理活性物质。例如含有噻唑活性基团的氨噻肟酸的头孢类药物是当今抗生素的热门,随着合成化学药物化学和农药化学的迅猛发展,必将出现更多具有生物活性功能的噻唑类化合物。席夫碱的研究进展席夫碱的概述席夫碱是氮原子与碳原子用双键连结形成的类化合物,亚胺是由醛或酮与氨或胺缩合而成的,亚胺基是极活泼的基团,与丙二酸二乙酯反应生成氨基酸,还原反应生成胺,与格利雅试剂反应生成胺的衍生物,具有优良液晶特性,用作有机合成试剂和液晶材料。席夫碱的反应机理在年首更好的应用在实际生活上。因此,从这此实验我们得到的结论是尽量选择数据最开始的连续的点作为初始点,这样可以用最少的迭代次数完成聚类改变均值算法的初始点可以影响数据集的迭代次数,对聚类结果影响不大每次初始值的改变也会造成数据输出顺序的改变,即使是在聚类结果不变的情况下。实验二本次试验是验证不同的数据输入顺序,对聚类结果的影响,实验的数据集为了更具说服力,还是用实验中的数据,不同之处是,此次实验只是将数据集中的后个数放到前面,也就是与前个数调换下顺序,本次试验只是验证数据集输入顺序的改变对聚类结果的影响,所以只选取两种初始值进行验证,与实验进行对比,可得实验结果如下令前三个数据作为初始聚类中心,如图所示图数据输入顺序改变聚类图把第个数据作为初始聚类中心,得到的聚类结果如图所示图数据输入顺序改变聚类图实验分析与结论分析本次实验主要是与之前的数据顺序不同时所得的聚类结果,由图与图,图与图的对比结果可得出,改变了数据的输入顺序,造成聚类结果有很大的改变,同时迭代次数也增加了,这说明均值算法对数据输入顺序的敏感性不仅体现在迭代次数上,而且更会改变数据的迭代次数。另外,再对比图与图的结果,虽然两次的聚类结果是样的,但是迭代的次数当选取第个数据为初始点比选取第个数据为初始点迭代次数有所增加,聚类结果的输出顺序也有所改变,同时也验证了实验的结论。结论由实验可得均值算法对数据集的输入顺序也是敏感的,不同的的顺序会有不同的聚类结果,这也是今后改进算法可以尝试的方向,也可以在应用该算法时,通过改变数据集的输入顺序来适当提高聚类效果。本次试验改变了输入顺序反而使迭代次数增加,很可能再次改变输入顺序会让迭代次数减少,这些都说明均值算法对数据输入顺序特别敏感,因此我们得到的结论是当我们聚类数据集迭代次数很多时,我们可以适当改变下数据的输入顺序均值算法的聚类结果对数据输入顺序很敏感,与之前没有改变顺序之前的聚类结果差距很明显,所以不要轻易变动数据集的输入顺序本章小结本章主要是实现均值算法,并且在实现该算法的基础上,对影响均值聚类效果的两方面因素初始点的选择和数据输入顺序两个方面的因素对聚类结果的影响情况进行验证。通过两个实验,实验有个运行结果,实验二有个运行结果,比较充分的验证了这两方面的因素对聚类结果的影响,并通过对比试验结果,得到结论初始点选取的不同会影响数据集的迭代次数,不会特别明显的影响聚类结果,而不同的数据输入顺序,会对聚类结果造成明显的影响,同时也会改变迭代次数,这些结论为用户在将来使用传统均值算法的时候提供些降低因均值算法的缺陷带来的损失和避免造成不必要麻烦的建议。总结与展望总结本文主要介绍了数据挖掘中的聚类分析,对聚类分析中的均值算法进行了探索研究,主要是对影响均值算法的聚类效率因素的探究。首先,介绍了本文的研究背景与本文的研究意义,简单介绍了数据挖掘的背景,着重介绍了聚类分析目前研究的国内外成本元单位成本元吨总成本元计划编制档案管理订单处理打印派车单回访车辆信息收集运费
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
第 1 页 / 共 37 页
第 2 页 / 共 37 页
第 3 页 / 共 37 页
第 4 页 / 共 37 页
第 5 页 / 共 37 页
第 6 页 / 共 37 页
第 7 页 / 共 37 页
第 8 页 / 共 37 页
第 9 页 / 共 37 页
第 10 页 / 共 37 页
第 11 页 / 共 37 页
第 12 页 / 共 37 页
第 13 页 / 共 37 页
第 14 页 / 共 37 页
第 15 页 / 共 37 页
预览结束,还剩
22 页未读
阅读全文需用电脑访问
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。
1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。