,即均值为,标准差为,其转化函数为其中为所有样本数据的均值,为所有样本数据的标准差。聚类分析聚类是将数据分类到不同的类或者簇这样的个过程,所以同个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。从统计学的观点看,聚类分析是通过数据建模简化数据的种方法。传统的统计聚类分析方法包括系统聚类法分解法加入法动态聚类法有序样品聚类有重叠聚类和模糊聚类等。采用均值中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如等。从机器学习的角度讲,簇相当于隐藏模式。聚类是搜索簇的无监督学习过程。与分类不同,无监督学习不依赖预先定义的类或带类标记的训练实例,需要由聚类学习算法自动确定标记,而分类学习的实例或数据对象有类别标记。聚类是观察式学习,而不是示例式的学习。聚类分析是种探索性的分析,在分类的过程中,人们不必事先给出个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同组数据进行聚类分析,所得到的聚类数未必致。从实际应用的角度看,聚类分析是数据挖掘的主要任务之。而且聚类能够作为个独立的工具获得数据的分布状况,观察每簇数据的特征,集中对特定的聚簇集合作进步地分析。聚类分析还可以作为其他算法如分类和定性归纳算法的预处理步骤。聚类分析是种探索性的数据分析方法。根据目标研究对象的数值属性特征,采用数学方法对之进行分类整理再对同类个体的共性及差异作进步的归纳,从而得到新规律。近年来聚类分析研究发展迅速,从数学统计学信息学人工智能等角度不断有新的方法提出改进,并在经济学地质学气象学生物学等领域得到成功的应用。在目前生物信息学领域的研究中,聚类分析受到广泛重视。在基因的表达序列的研究中,聚类分析己经成为标准的程序。展望生物技术发展的特点,是将产生数量极为巨大的数据二是基于这些大量的数据,科研活动将逐步从传统的以实验为主的方式向数据分析与实验相结合的方式过渡。在这过程中,统计聚类分析将是开展数据分析工作的基石。南京邮电大学届本科生毕业设计论文生物信息工具箱中包含的函数即用于数据的聚类分析。生物信息工具箱中这函数主要用于基因表达数据的分析,不仅可横向聚类,还可以纵向聚类。数据标准化实现本节使用多种方法来实现基因芯片数据标准化,使用的基因芯片数据来自小鼠帕金森疾病全方位立体的脑基因表达图谱,基因研究,。本文所用的基因芯片数据来源于小鼠脑的三维像素图,正常小鼠的微列阵数据存放于生物信息工具箱的文件中,通过使用甲基苯异丙胺处理小鼠而建立起个帕金森疾病的药理学模型,相应的微列阵数据存放于文件中。可用函数读取基因芯片数据文件到结构变量中用结构名成员名显示指定成员的详细内容。列名称存放在成员中,下列命令可显示列名称基因名称保存在成员中,下列命令可显示头个基因的名称基因芯片数据的空间图像利用函数可用组矩阵数据构造幅数据排列。比如绘制基因芯片数据的伪彩色空间图像。绘制红色通道的中值图谱下列命令绘制数据点中值图,显示红色通道的中值像素。如图,用鼠标单击图中的任何点都会显示相应的值名称及号南京邮电大学届本科生毕业设计论文图绘制绿色通道的中值图谱下列命令绘制数据点中值图,显示绿色通道的中值像素,如图图绘制红色背景的中值图谱下列命令绘制背景中值图,显示红色通道背景的中值,可以看到高背景区域出现在图的右边,如图南京邮电大学届本科生毕业设计论文图分绘制绿色背景的中值图谱下列命令绘制背景中值图,显示绿色通道背景的中值,可以看到高背景区域出现在图的右边,如图图读取正常小鼠的数据可用同样的方法绘制正常小鼠的相关图谱,其中样本用通道,而小鼠全脑用通道。下列命令可读取正常小鼠的数据南京邮电大学届本科生毕业设计论文绘制伪彩色图像用函数分别绘制结构的和的中值图和背景中值图,如图。图查看背景图像的比例尺,发现正常小鼠的背景水平明显高于帕金森小鼠的背景水平,并且有非随机的因素影响了图片中通道的背景。为了更好地分析问题,可用命令修改调色板色彩对图片进行色彩变换。图函数提供了种快速创建基因芯片伪彩色图像的方法,如果用户想更好地绘图,还可以用函数创建用户需要的特定图像。如图南京邮电大学届本科生毕业设计论文图通过设定背景强度的上下限值,可以绘制对比度更好的图像,如图图基因芯片统计量用户可以用函数来分析每矩阵的数据分布。绘制矩阵的数据分布图。从图中可以清楚地看到显著位置的背景强度分布。第,阵列位于基因芯片的左边,而第,阵列位于阵列的右边,这些数据通过标准化消除了空间偏移偏差。南京邮电大学届本科生毕业设计论文图在基因芯片数据结构中有和两列数据,分别是各通道强度减去背景强度得到的中值。通过标准化消除空间偏移误差后,这两列数据表示的就是实际表达水平。对于个复杂大结构的微列阵数据,则可选取些列单独分析,使问题简化。比较双波道的简单方法之就是使用对数坐标图,函数可实现这个功能。图中对角线上的那些点就对应于三维像素图中表达水平较高的基因,如图图最后两行信息是出现了负数和零元素的警告,原因是和列的些值等于小的点和信噪比太大的点也同样会被认为是损南京邮电大学届本科生毕业设计论文坏的点。可用函数消除警告信息如图。虽然警告信息可以被忽略,但是更应该找出它们产生的原因,而不是简单地忽视它们。图忽视或禁止那些警告信息的简单方法之是从数据段中直接消除那些损坏的点。通过设定个阈值,然后找出通道中值小于或等于这个阈值的点,下列命令设定阈值为。然后找出并消除或中小于或等于阈值的点。下面是重新绘制消除坏点后的对数坐标图,如图。图我们只是显示了点的分布。没有给出哪个基因对应哪个点的信息。为此,需要把基因标签添加到图中。由于些数据点已经被消除了,使用基因标签之前要南京邮电大学届本科生毕业设计论文从数据段中消除相应的,如图。个简单的方法就是使用函数。图用鼠标点击那些逸出的点,就可以显示与这个点相关的基因。理想的情况下所有的点应该均匀地分布在的直线的两边,但实际上大部分逸出的点都位于这条直线以下。标准化这些逸出点并将它们平均地分配在直线的两边,可用函数使全部的平均数标准化。绘制标准化数据图,这些点都更均匀地分布在南京邮电大学届本科生毕业设计论文
            
            
         
        
        
            温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
 
            
                
                
                第  1  页 / 共 46 页
                
                
                第  2  页 / 共 46 页
                
                
                第  3  页 / 共 46 页
                
                
                第  4  页 / 共 46 页
                
                
                第  5  页 / 共 46 页
                
                
                第  6  页 / 共 46 页
                
                
                第  7  页 / 共 46 页
                
                
                第  8  页 / 共 46 页
                
                
                第  9  页 / 共 46 页
                
                
                第  10  页 / 共 46 页
                
                
                第  11  页 / 共 46 页
                
                
                第  12  页 / 共 46 页
                
                
                第  13  页 / 共 46 页
                
                
                第  14  页 / 共 46 页
                
                
                第  15  页 / 共 46 页
                
             
            
            
                
                预览结束,还剩 
31 页未读
                
阅读全文需用电脑访问
                
             
            
            
                
                
                    1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
                    2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
                    3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。
                 
             
            
                
                1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
                
                2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
                3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
                4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
                5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。