帮帮文库

基于遗传算法的k-means聚类挖掘算法的研究 基于遗传算法的k-means聚类挖掘算法的研究

格式:DOC | 上传时间:2022-06-25 17:08 | 页数:66 页 | ✔ 可以修改 | @ 版权投诉 | ❤ 我的浏览
基于遗传算法的k-means聚类挖掘算法的研究
基于遗传算法的k-means聚类挖掘算法的研究
1 页 / 共 66
基于遗传算法的k-means聚类挖掘算法的研究
基于遗传算法的k-means聚类挖掘算法的研究
2 页 / 共 66
基于遗传算法的k-means聚类挖掘算法的研究
基于遗传算法的k-means聚类挖掘算法的研究
3 页 / 共 66
基于遗传算法的k-means聚类挖掘算法的研究
基于遗传算法的k-means聚类挖掘算法的研究
4 页 / 共 66
基于遗传算法的k-means聚类挖掘算法的研究
基于遗传算法的k-means聚类挖掘算法的研究
5 页 / 共 66
基于遗传算法的k-means聚类挖掘算法的研究
基于遗传算法的k-means聚类挖掘算法的研究
6 页 / 共 66
基于遗传算法的k-means聚类挖掘算法的研究
基于遗传算法的k-means聚类挖掘算法的研究
7 页 / 共 66
基于遗传算法的k-means聚类挖掘算法的研究
基于遗传算法的k-means聚类挖掘算法的研究
8 页 / 共 66
基于遗传算法的k-means聚类挖掘算法的研究
基于遗传算法的k-means聚类挖掘算法的研究
9 页 / 共 66
基于遗传算法的k-means聚类挖掘算法的研究
基于遗传算法的k-means聚类挖掘算法的研究
10 页 / 共 66
基于遗传算法的k-means聚类挖掘算法的研究
基于遗传算法的k-means聚类挖掘算法的研究
11 页 / 共 66
基于遗传算法的k-means聚类挖掘算法的研究
基于遗传算法的k-means聚类挖掘算法的研究
12 页 / 共 66
基于遗传算法的k-means聚类挖掘算法的研究
基于遗传算法的k-means聚类挖掘算法的研究
13 页 / 共 66
基于遗传算法的k-means聚类挖掘算法的研究
基于遗传算法的k-means聚类挖掘算法的研究
14 页 / 共 66
基于遗传算法的k-means聚类挖掘算法的研究
基于遗传算法的k-means聚类挖掘算法的研究
15 页 / 共 66

1、局部最优解。产生出新代的种群。判断结束条件,当条件满足时结束操作,输出结果否则,转向第步。改进型遗传的伪代码描述为初始化聚类样本集,聚类数初始种群大小,交叉概率变异概率,最大迭代次数为进化代数计数器初始化种群计算第代种群中各个体的适应度对代种群进行选择交叉变异操作对遗传操作后的种群进行优化,产生新的种群输出末代的最优个体。改进型遗传算法的流程图如下输入参数,数据集产生新代种群变异操作输出最佳聚类中心交叉操作选择操作对种群个体进行适应度计算优化操作生成初始种群将聚类中心编码成位串是否满足终止条件否是图改进型遗传算法的流程图目标函数改进型遗传聚类算法目标与聚类算法是致的,即将包含个对象的集合划分为个类,每个对象都是维向量,最终使目标函数最小化。因此算法的。

2、机会就相对较少。遗传算法中的选择操作体现了这适者生存的原则适应度越高的个体,参与后代繁殖的概率越高。遗传算法中的选择操作就是用来确定如何从父代群体中按照种方法选取哪些个体遗传到下代群体中的种遗传运算。选择操作是建立在对个体的适应度进行评价的基础之上。选择操作的主要目的是为了避免基因缺失提高全局收敛性和计算效率。为了保证适应度最好的染色体保留到下代群体而不被遗传操作破坏掉,根据目前已有的选择方法,本文采用了轮盘赌和最优策略保存法相结合的混合选择算子。该选择算子具体操作如下首先在计算完当前种群的适应度后,记录下其中适应度最大的个体再根据各个体的适应度值,,计算各个体的选择概率式中,为种群大小,为所有个体适应度的总和。根据计算出的选择概率,使。

3、指分别用符合范围内均匀分布的随机数,以较小的概率来替换个体编码操作中各个基因座上的原有基因值。而对于浮点数编码的个体,若变异点处的基因的取值范围为变异操作就是用该范围内的个随机数去替换原基因值。针对本文所使用的是浮点数编码方式,这里采用均匀变异算子来完成变异操作。假设条染色体为,则均匀变异的具体操作过程如下依次指定个体编码串中的每个基因座为变异点,并确定每个基因点的取值范围对每个变异点,以变异概率从对应基因的取值范围内取个随机数来代替原有值。其中变异点的新基因值为式中,为,范围内符合均匀概率分布的个随机数。优化操作由于是种局部搜索能力强的算法,本算法在每代执行完遗传操作后引入了算法中的个操作步骤操作,对新生种群中的每个个体进行优化,优化。

4、代个体的适应值普遍较差,影响了算法的效率。为了改善这种情况,又因为本文所使用的是浮点数编码方式,本文采用了种以算术交叉为基础的混合交叉算子,即基于最短距离基因匹配的算术交叉算子。算术交叉是指由两个个体的线性组合而产生出两个新的个体。假设在两个个体和之间进行算术交叉,则交叉后产生的新个体为其中,为个参数,当为常数时,则交叉运算为均匀交叉,否则,为非均匀交叉。假设待交叉的两条染色体为和其中,为个聚类中心,则该混合交叉算子具体操作如下首先比较染色体的第个基因与上的每个基因的距离将上与距离最近的基因选出,并放在条与等长的空染色体上按照上面方法依次比较上其他基因与上剩余基因的距离,并把每次选出的基因按。

5、算法来求解聚类问题,这也显示了遗传算法与求解问题无关的强大通用性。改进的遗传算法为了能够让遗传算法和算法的结合更好地弥补它们各自的缺陷,同时提高算法的收敛速度并改善聚类结果,本文算法主要从四个方面对传统遗传算法聚类做了改进首先,采用了把聚类中心作为染色体的浮点数编码方式,这样既使大数据集的编码过程得到了简化,又减少了整个算法的运算量其次,为了保证进化过程中每代当前最优个体不被遗传操作破坏,采用了轮盘赌和最优保存策略相结合的混合遗传算子再次,在交叉操作中,为了减少无意义个体的产生,先对交叉个体进行了基于最短距离的基因匹配,然后再运用算术交叉来增强遗传算法的局部搜索能力最后,为了提高遗传聚类的收敛速度,在每代遗传操作结束之后对要进入下代的群体进行优化操作。

6、轮盘赌法选出个体被选出的个体参加交叉变异操作产生新的群体计算出新群体中的各条染色体的适应度值,用上代中所记录的最优个体替换掉新种群中的最差个体,这样产生了下代群体。这种遗传操作既不断提高了群体的平均适应度值,又保证了最优个体不被破坏,使得迭代过程向最优方向发展。交叉操作交叉操作是把两个父个体的部分结构加以替换重组而产生新个体的操作,也称为基因重组。交叉的目的是为了能够在下代产生新的个体,因此交叉操作是遗传算法的关键部分,交叉算子的还坏,在很大程度上决定了算法性能的好坏。由于染色体以聚类中心矩阵为基因,造成了基因串的无序性,两条染色体的等位基因之间的信息不定相关,如果采用传统的交叉算子进行交叉,致使染色体在进行交叉时,不能很好的将基因配对起来,使生成的。

7、标函数采用算法的聚类目标函数式,又可表示为编码方法按照遗传算法的程序流程,用遗传算法求解问题,首先要解决的问题是如何确定编码和解码运算,编码形式决定了交叉算法和变异算子的操作方式,对于算法的性能如搜索能力和计算效率等影响很大。常用的编码方案有浮点数编码和二进制编码。浮点数编码方法又叫真值编码方法,它是指个体的每个基因值用范围内的个浮点数来表示,个体的编码长度等于其决策变量的个数,具有适合于大空间搜索局部搜索能力强不已陷入局部极值收敛速度快的特点。由于聚类样本具有多维性数据量大的特点,如果采用传统的二进制编码染色体的长度会随着维数的增加或精度的提高而显著增加,从而使得搜索空间急剧增大,大大降低了计算效率。基于上面分析,这里采用浮点数编码。在。

8、传聚类问题中,可采用的染色体编码方式有两种是按照数据所属的聚类划分来生成染色体的整数编码方式是把聚类中心聚类原型矩阵作为染色体的浮点数编码。聚类问题的解是各聚类中心,因此本文采用基于聚类中心的浮点数编码。所谓的将聚类中心作为染色体的浮点数编码,就是把条染色体看成由个聚类中心组成的个串。具体编码方式如下对于维样本数据的类聚类分析,基于聚类中心的染色体结构为即条染色体是个长度为的浮点基因串。这种编码方式意义明确直观,避免了二进制编码在运算过程中反复进行译码解码以及长度受限等问题。种群初始化确定了编码方式之后,接下来要进行种群初始化。初始化的过程是随机产生个初始种群的过程。首先从样本空间中选个个体,值由用户自己来指定,每个个体表示个聚类中心。

9、树关联规则聚类分析等方面的文献不断涌现,遗传算法已是数据挖掘领域的个重要课题。遗传算法效仿了生物的进化过程,通过种群代又代地繁殖和交换,它能搜索到多个局部极值,从而增加了找到全局最优解的可能行。将遗传算法引入到聚类中,可以提高聚类算法的找到全局最优的可能性。用遗传算法求解聚类问题,首先要解决三个问题如何将聚类问题的解编码到个体中如何构造适应度函数来度量每个个体对聚类问题的适应程度,即如果个体的编码代表良好的聚类结果,则其适应度就高反之,其适应度就低。适应度函数类似于有机体进化过程中环境的作用,适应度高的个体在代又代的繁殖过程中,产生出较多的后代,而适应度低的个体则逐渐消亡如何选择各个遗传操作以及如何确定各控制参数的取值。解决了这些问题后就可以利用遗传。

10、算法流程通过上面的描述可知,与基本遗传算法的总体运行过程相比,算法也是从随机产生的初始群体开始全局最优解的搜索过程,只不过它在进行遗传操作后,再对生成的种群中的每个个体进行步优化操作,然后将优化后的结果作为下代的种群。这个过程反复迭代进行,直到达到最大代数或者结果符合要求为止。改进的遗传算法流程描述如下参数设置样本数,聚类数,种群大小,最大迭代次数,交叉概率,变异概率。种群初始化从样本中随机选取个点作为聚类中心并进行编码,重复次,产生初始种群。对种群中的个体进行适应度计算根据计算处的适应度值,对种群进行选择操作。对选出的个体进行交叉操作。对交叉后的个体进行变异操作,产生新的种群。对产生的新种群中的每个个体执行操作,将其优化为以该个体为初始值的均值问题。

11、序放在上,生成了条与相配对的染色体根据交叉概率随机选取个交叉位置,对和进行算术交叉得到下代个体和。最近邻基因匹配的算术算子能够尽量保证产生有意义的新个体,以提高遗传算法的收敛速度。变异操作在生物的自然进化的过程中,其细胞分裂的过程可能会出现些差错,导致变异情况的发生。变异操作就是模仿这种情况产生的。所谓变异操作,是指将个体染色体编码串中的些基因座上的基因值用该基因座的其他等位来替换,从而形成个新的个体。变异的目的有二是增强算法的局部搜索能力二是增加种群的多样性,改善算法的性能,避免早熟收敛。变异操作既可以产生种群中没有的新基因又可以恢复迭代过程中被破坏的基因。常用的变异算子有基本位变异均匀变异边界变异非均匀变异和高斯近似变异。均匀变异。

12、根据我们所采用的编码方式把这组个体聚类中心编码成条染色体。然后重复进行次染色体初始化,为种群大小。适应度函数的设计适应度函数是用来评价个体的适应度,区别群体中个体优劣的标准。由于聚类问题实际上是找到种划分,也就是要使待聚类数据集的目标函数达到最小化。遗传算法在处理过程中对每个染色体,采用与算法相同的方式进行类别划分和重新计算各聚类中心,算法是根据式每个聚类中的点与相应聚类中心的距离作为判别聚类划分质量好坏的准则函数,越小表示聚类划分的质量越好。遗传算法的目的是搜索使目标函数值最小的聚类中心,因此可借助目标函数来构造适应度函数如下式选择操作在生物的遗传和自然进化的过程中,对生存环境适应度较高的物种将有更多的机会遗传到下代而适应度较低的物种遗传到下代。

参考资料:

[1](定稿)2千吨核桃加工制品车间项目投资立项申报材料(最终定稿)(第29页,发表于2022-06-25 17:50)

[2](定稿)2千吨机械配件生产项目投资立项申报材料(最终定稿)(第34页,发表于2022-06-25 17:50)

[3](定稿)2千吨有机蜂蜜加工扩建项目投资立项申报材料(最终定稿)(第62页,发表于2022-06-25 17:50)

[4](定稿)2千吨日反渗透海水淡化工程项目投资立项申报材料(最终定稿)(第13页,发表于2022-06-25 17:50)

[5](定稿)2千吨方便米粉生产线项目投资立项申报材料(最终定稿)(第47页,发表于2022-06-25 17:50)

[6]基于射频识别技术的智能计件系统的设计与研究(第57页,发表于2022-06-25 17:50)

[7]基于射频识别技术(RFID)的汽车防盗系统的设计(最终版)(第37页,发表于2022-06-25 17:50)

[8]基于社区认同的社区管理体制的研究(第37页,发表于2022-06-25 17:50)

[9]基于社交网络的英语学习平台软件的设计与开发(第37页,发表于2022-06-25 17:50)

[10]基于三坐标测量仪的油泵体零件检测方案制订与实施的设计(第54页,发表于2022-06-25 17:50)

[11]基于三维模具技术的LED灯配件模具设计与制造的设计(最终版)(第22页,发表于2022-06-25 17:50)

[12]基于三菱PLC自动送料小车的设计(第35页,发表于2022-06-25 17:50)

[13]基于三菱PLC的无人看守铁路道口自动控制系统的设计(第23页,发表于2022-06-25 17:50)

[14]基于三菱PLC车库自动管理系统的设计(第24页,发表于2022-06-25 17:50)

[15]基于三阶段dea模型的我国第三方物流企业效率评价的研究(第51页,发表于2022-06-25 17:50)

[16](定稿)2千吨废弃电子线路板无害化处理项目投资立项申报材料(最终定稿)(第91页,发表于2022-06-25 17:50)

[17](定稿)2千吨干红红枣酒生产线项目投资立项申报材料(最终定稿)(第98页,发表于2022-06-25 17:50)

[18](定稿)2千吨复合薄膜项目投资立项申报材料(最终定稿)(第25页,发表于2022-06-25 17:50)

[19](定稿)2千吨塑钢型材、1千套实木家具项目投资立项申报材料(最终定稿)(第42页,发表于2022-06-25 17:50)

[20](定稿)2千吨塑料复合包装生产线项目投资立项申报材料(最终定稿)(第37页,发表于2022-06-25 17:50)

下一篇
温馨提示

1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。

2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。

3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。

4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。

5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。

帮帮文库——12年耕耘,汇集海量精品文档,旨在将用户工作效率提升到极致