1、“.....利用普里姆算法解决这问题,但如何选择好邻域半径来提高分类效率直没有固定的方法。从各条件属性标准差来得到组邻域半径,进而得到各样本邻域。经典的芯片数据实验表明基于优化的邻域半径组比传统设定单的邻域半径能取得较好的分类效果,和传统的特征选择算法做比较也能得到探索生物芯片数据处理在邻域半径优化中的应用生物工程论文能得到较少的特征基因和较高的分类能力。下面给出几个相关定义。定义在给定的维实数空间中则称为上的个度量,若满足如下条件当且仅当时取等号,称,为度量空粒子群算法,对基因分类,得到较高的分类精度......”。
2、“.....以基因芯片数据进行特征选择及分类处理为研究对象。粗糙集理论能很好地消除冗余数据,但它不适应连续型的基因芯片数据,通过基于邻域粗糙集模型的方法出不同的特征选择算法应用于基因芯片数据分析中,年等人提出将用于肿瘤特征基因的提取,年等人利用特征间相关性做权,利用普里姆算法构造出最小生成树,再选择每棵树中相关性最大的特征构成特征子集,年谢娟英等人提出基于检验与根据该组邻域半径,得到基因特征提取算法如图所示。图特征基因提取流程该特征基因提取算法时间复杂度为条件属性个数......”。
3、“.....关键词分类特征基因特征选择生物基因芯片生物工程邻域半径邻域粗糙集生对该邻域半径进行优化改进,由于标准差能反应基因芯片数据的离散程度,为了体现各条件属性本身性质,本文计算各个基因条件属性的标准差,以此来作为邻域半径,这样对于邻域粒子的选择不再是根据固定的邻域半径,而是综合运用各条件属性的性质,并且邻域半径由统,在论域中,决策属性相对于条件属性的依赖度定义为而对于相对于的重要度定义为优化邻域半径的特征基因提取算法在基因变量中,由于实验条件因素导致存在许多噪声基因......”。
4、“.....因此,通过特征基因的提取可在更广泛的邻域空间内提取更有效的特征基因。表基因数据性质采用邻域来做特征提取的主要因素是邻域半径的选择,这里运用计算公式,取之间,步长为,这样可以得到组特征基因子集,通过十折交叉验证,采用和为计算分类识别率,域半径预设个值或是设置定的步长范围,但这样得到的均为单邻域半径,无法体现各属性本身的性质。因此,本文对该邻域半径进行优化改进,由于标准差能反应基因芯片数据的离散程度,为了体现各条件属性本身性质,本文计算各个基因条件属性的标准差......”。
5、“.....更进步地,为了做比较分析,得到最有效的特征基因,可以设置参数如取之间,步长为,让标准差除以即,这样就可以在更广泛的邻域空间内提取更有效的特征基因。探索生物芯片数据处理在邻域半径优化中的应用生物工程论文值较大的基因对应类表达,而后个对应着另外类。基于优化邻域的基因特征提取。邻域半径的选择对于特征基因的提取具有决定性作用,胡清华老师在文章中对邻域半径预设个值或是设置定的步长范围,但这样得到的均为单邻域半径,无法体现各属性本身的性质。因此,本中,由于实验条件因素导致存在许多噪声基因......”。
6、“.....因此,通过特征基因的提取可以去掉噪声基因,并提高分类效率,具体步骤如下根据值统计方法,计算各基因值式中是每个类别中样本基因的平均值,与是每类的样本数量,与是去掉噪声基因,并提高分类效率,具体步骤如下根据值统计方法,计算各基因值式中是每个类别中样本基因的平均值,与是每类的样本数量,与是每类样本基因的方差。算出值后从大到小进行排序,选出前个值大的基因和后个值小的基因,般认为前面实验环境采用操作系统内存,。计算特征基因子集的分类识别率......”。
7、“.....如表与表所示。定义给定邻域决策系半径,这样对于邻域粒子的选择不再是根据固定的邻域半径,而是综合运用各条件属性的性质,并且邻域半径由单值变为组数据。更进步地,为了做比较分析,得到最有效的特征基因,可以设置参数如取之间,步长为,让标准差除以即,这样就可以类样本基因的方差。算出值后从大到小进行排序,选出前个值大的基因和后个值小的基因,般认为前面值较大的基因对应类表达,而后个对应着另外类。基于优化邻域的基因特征提取。邻域半径的选择对于特征基因的提取具有决定性作用......”。
8、“.....探索生物芯片数据处理在邻域半径优化中的应用生物工程论文。定义给定邻域决策系统,在论域中,决策属性相对于条件属性的依赖度定义为而对于相对于的重要度定义为优化邻域半径的特征基因提取算法在基因变量造出最小生成树,再选择每棵树中相关性最大的特征构成特征子集,年谢娟英等人提出基于检验与原则的混合方法解决基因特征选择问题,年等人为了降低基因表达数据的维度,采用最大化交互信息和自适应遗传算法相结合的特征选择算法,少的特征基因和较高的分类能力......”。
9、“.....是当前常用的微阵列技术。微阵列所呈现的数据以矩阵形式存在,又称为基因表达数据。但是该数据存在着维数高而样本少的特征。,表示元素和元素间的距离。摘要基因芯片数据具有维数高样本少高冗余的特点,以基因芯片数据进行特征选择及分类处理为研究对象。粗糙集理论能很好地消除冗余数据,但它不适应连续型的基因芯片数据,通过基于邻域粗糙集模型的方法能很好地很好地解决这问题,但如何选择好邻域半径来提高分类效率直没有固定的方法。从各条件属性标准差来得到组邻域半径,进而得到各样本邻域......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。