析算法效率的分析也就是对算法时间复杂度的分析,而个算法的质量优劣将直接受算法乃至程序效率的影响。本文算法是在算法聚类的基础上应用算法进行文本分类的,故在此将分别对算法聚类和算法分类的效率进行分析。训练文档集数目个对象进行层次聚类的平均复杂度为,最坏复杂度为。考虑到特征的因素,在个特征词构成的空间中,对个文档特征矢量进行聚类的平均复杂度为,最坏复杂度为。也就是说算法聚类的最小复杂度为,与训练集数目的平方值有关。算法本身简单有效,它是种算法,分类器不需要使用训练集进行训练,训练时间复杂度为。而分类的计算复杂度和训练集中的文档数目成正比,也就是说,如果训练集中文档总数为,那么的分类时间复杂度为。综上所述,如有文档数为的训练集,用经典算法分类,则其分类时间复杂度为。而如果用本文算法分类,设聚类后形成的新的训练集文档数为,其中,则其分类时间复杂度为,。由此知,在分类时间复杂度上本文算法优于经典的算法。但经典的算法不需要使用训练集进行训练,训练时间复杂度为。而本文算法需要先对训练集聚类,而聚类的平均复杂度为。由此可知,本文算法在前期准备工作上稍有欠缺。本章小结本章首先介绍了半监督学习算法以及文本分类算法,然后在此基础之上提出了基于和的半监督的文本分类算法,最后重点研究了该算法的具体实现,并给出了算法的具体思想和算法的步骤以及其效率分析。实验与分析实现算法实验平台实验平台为,规格,内存为实验开发环境。算法实现及流程图算法实现本文所研究的算法是通过编程实现的。算法中的聚类和分类都很好的通过语言编程实现。算法界面如图示图聚类界面以上界面是聚类的实现,对训练样本进行聚类,其基本伪代码为最终聚类结果如图示图聚类结果图所示界面为分类界面输入训练样本的向量集初始假设协方差矩阵为单位阵,先验概率为整体均值计算协方差矩阵,聚类中心最大化最大化高斯模型中的权重均值协方差迭代不断迭代和步骤输出向量类别期望矩阵聚类中心协方差矩阵。图分类界面在聚类基础上,对测试文本进行分类,其基本伪代码为最终分类结果如图示。图分类结果输入测试文档的向量集计算测试文档与聚类中心和未聚类文档的欧几里得距离比较比较计算出的各个距离的大小分类将测试文档分到距离最小的那个类中输出文档所属类别。流程图训练集特征标示特征选择开始训练样本的预处理训练样本聚类计算中心点中心点与其它样本点组成新的训练集计算新样本与训练集样本的距离判断类别并计算相似度结束是否是否还有新样本取新样本图算法流程图实验结果与分析本实验中用到得数据集为数据库中的数据集,即数据集。此数据集有个样本,共分为三类。其中个样本作为训练集,剩余的个样本作为测试集。用本文算法通过实验得到结果如表示表算法实验结果类别该类总数正确判为该类的数判为该类的总数第类第二类第三类由上表可知召回率准确率当时,值之后本文算法分别与和算法进行了对比,其结果如表示表三种算法结果算法召回率准确率时,值分类时间复杂度,算法经典由表可知算法与传统算法方差矩阵组成。密度函数如下,图聚类分类图该分布可由个高斯密度函数的加权平均所表示的概率密度函数描述如下,聚类的算法假设存在个完整数据集,,是不完整的数据集,是引入的隐含变量。,,是给定的有限整数。于是则完整数据的似然函数为,该似然函数的期望值采用算法的基本思想是对于上述的不完整数据集,假设这些数据独立同分布于我们已知的个模型,如,而我们知道该模型的参数,因此可以根据该模型推出属于每个成分的各数据点的概率,然后修改每个成分的值,重复该过程直到收敛到结束条件。显然,辅助函数,的值就是,的期望值,并且是的函数,是上步迭代运算求得的参数值。,求解,使得,得到极大值。可以看出,随机向量的分布是由和决定的,若表示第次迭代的最大似然函数值,表示第次迭代的最大似然函数值,可知证明,算法能够保证,并且算法是收敛的。高斯混合模型里,假设完整数据为,,为可观测变量,为隐含变量,设是独立同分布于类,其概率分别为,并且由给出的的密度为。完整数据的似然函数为算法是在和之间迭代。在,由可观测变量和当前的参数估计,计算出完整数据似然的条件期望值。中,根据的值,计算使得似然函数值最大的参数估计。基于算法的分类此处基于算法的文本分类与节介绍的经典算法大致相似,但此算法分类是在前期算法对训练集聚类分析的基础上进行操作的。具体步骤如下根据算法的聚类结果,对每类计算出其中心点在众多中心点中选出与新文档最相似的个中心点,公式为,其中,值的确定目前还没有很好的方法,般采用先定个初始值,然后根据实验测试的结果调整值。在新文本的个邻居中依次计算每类的权重,公式为,其中,为新文本分特征向量,,为相似度计算公式,与上步的计算公式相同,而,为类别属性函数,即如果属于,那么函数值为,否则为零。比较类的权重,将文本分到权重最大的那个类别中。算法步骤针对以上两节提出的算法和算法,本文将二者结合在起提出了种基于和的半监督文本分类算法,算法流程如图示图新文档所属类别图样本点原始分布图样本中的中心点图聚类后的结果图新文档与中心点之间的欧几里得距离图算法步骤流程其中,红色圆点为标示样本,黑色为类别中心点,三角为待分类样本。由上图可以十分清楚的了解到分类算法的步骤,具体如下假设有个训练集,类别,每个类别中有若干个训练样本。对训练集中的文档进行预处理,得到图的样本点分布根据标示样本应用算法进行聚类,图所示计算聚类后每类的中心点,中心点与未聚类样本组成新的训练集,图所示计算新文档与中心点和其它样本点之间的欧几里距离如,两点,和,的欧几里德距离是,,图所示将新文档分到距离最近的类中,图所示。算法效率分和算轴负荷转移系数取及为钢板弹簧前后段长度为钢板弹簧总截面系数,为弹簧固定点到地面的距离。流动警务车驱动时,后钢板弹簧所受的载荷最大,它的前半段出现最大应力为此外,还应当验算汽车通过不平路面时钢板弹簧的强度。许用应力取为。钢板弹簧卷耳和弹簧销的强度核算钢板弹簧主片卷耳受力如图示。卷耳处所受应力是由弯曲应力和拉压应力合成的应力图制动时钢板弹簧的受力图式中,为沿弹簧纵向作用在卷耳中心线上的力为卷耳内径为钢板弹簧宽度为主片厚度。汽车制动时作用在钢板弹簧上的力和力矩如图所示汽车静止时,地面对前后轮上的反作用力分别为式中为汽车总重分别为汽车质心到前后轴的汽车制动时忽略汽车的滚动阻力偶矩空气阻力,以及旋转质量减速时产生的惯性力偶矩。对后轮接地点取力矩,得对后轮接地点取力矩,得如果汽车制动时前后车轮都抱死,作用在整车质心上的制动力或者。地面作用于前后轴上的法向反作用力为比较式可以看出,由于汽车制动,前轮载荷增加,后轮载荷减小,减少量为轮胎有效半径为,作用在前后钢板弹簧的水平力以及制动力矩分别为所以前板簧水平方向的力为所以卷耳处应力卷耳许用应力取为。所以卷耳强度和适。钢板弹簧销和衬套挤压应力校核对弹簧销要验算钢板受静载荷时钢板簧销受到的挤压应力可以按照下式计算式中为满载静止时钢板弹簧端部的载荷为卷耳处叶片宽为钢板弹簧销直径。用钢或钢经液体碳氮共渗处理时,弹簧销许用挤压应力取为如果用钢或钢经渗碳处理或用钢经高频淬火后,其许用应力。所以满足。钢板弹簧多数情况下采用钢或钢制造。常采用表面喷丸处理工艺和减少表面脱碳层深度的措施来提高钢板弹簧的寿命。表面喷丸处理有般喷丸和应力喷丸两种,后者可使钢板弹簧表面的残余应力比前者大很多。在钢板弹簧的片数,宽度,片厚取定以后再计算钢板弹簧的满载偏频钢板弹簧的参数见下表。表钢板弹簧的设计参数钢板弹簧主片长钢板弹簧片宽钢板弹簧片厚钢板弹簧片数与主片等长的片数本章小结本章详细介绍了钢板簧的种类,各种类的弹性特性以及选取何种钢板弹簧。详细计算钢板弹簧的各参数,例如钢板簧的布置方案满载弧高钢板弹簧长度的确定钢板簧断面尺寸及片数的确定钢板断面宽度的确定钢板弹簧片厚的选择钢板弹簧断面形状的确定。详细介绍了钢板弹簧的校核,包括对钢板弹簧刚度的校核钢板弹簧总成在自由状态下的弧高及曲率半径的计算钢板弹簧的强度验算等。图双作用筒式减震器吊耳活塞杆工作缸筒活塞伸张阀储油缸筒压缩阀吊耳补偿阀流通阀导向座防尘罩油封第四章减震器减震器种类的选择悬架中般采用内部充有液体的液力式减震器。汽车车身和轮振动时,减震器的液体在经阻尼孔的摩擦和液体的黏性摩擦形成振动阻力,将振能量转变为热能,并散发到周围的空气中去,达到迅衰减振动的目的。减震器又分为单作用式和双作用式减震器,选择减震效果好的双作用减震器。根据结构形式,减震器又分为摇臂式和筒式两种。摇臂式能析算法效率的分析也就是对算法时间复杂度的分析,而个算法的质量优劣将直接受算法乃至程序效率的影响。本文算法是在算法聚类的基础上应用算法进行文本分类的,故在此将分别对算法聚类和算法分类的效率进行分析。训练文档集数目个对象进行层次聚类的平均复杂度为,最坏复杂度为。考虑到特征的因素,在个特征词构成的空间中,对个文档特征矢量进行聚类的平均复杂度为,最坏复杂度为。也就是说算法聚类的最小复杂度为,与训练集数目的平方值有关。算法本身简单有效,它是种算法,分类器不需要使用训练集进行训练,训练时间复杂度为。而分类的计算复杂度和训练集中的文档数目成正比,也就是说,如果训练集中文档总数为,那么的分类时间复杂度为。综上所述,如有文档数为的训练集,用经典算法分类,则其分类时间复杂度为。而如果用本文算法分类,设聚类后形成的新的训练集文档数为,其中,则其分类时间复杂度为,。由此知,在分类时间复杂度上本文算法优于经典的算法。但经典的算法不需要使用训练集进行训练,训练时间复杂度为。而本文算法需要先对训练集聚类,而聚类的平均复杂度为。由此可知,本文算法在前期准备工作上稍有欠缺。本章小结本章首先介绍了半监督学习算法以及文本分类算法,然后在此基础之上提出了基于和的半监督的文本分类算法,最后重点研究了该算法的具体实现,并给出了算法的具体思想和算法的步骤以及其效率分析。实验与分析实现算法实验平台实验平台为,规格,内存为实验开发环境。算法实现及流程图算法实现本文所研究的算法是通过编程实现的。算法中的聚类和分类都很好的通过语言编程实现。算法界面如图示图聚类界面以上界面是聚类的实现,对训练样本进行聚类,其基本伪代码为最终聚类结果如图示图聚类结果图所示界面为分类界面输入训练样本的向量集初始假设协方差矩阵为单位阵,先验概率为整体均值计算协方差矩阵,聚类中心最大化最大化高斯模型中的权重均值协方差迭代不断迭代和步骤输出向量类别期望矩阵聚类中心协方差矩阵。图分类界面在聚类基础上,对测试文本进行分类,其基本伪代码为最终分类结果如图示。图分类结果输入测试文档的向量集计算测试文档与聚类中心和未聚类文档的欧几里得距离比较比较计算出的各个距离的大小分类将测试文档分到距离最小的那个类中输出文档所属类别。流程图训练集特征标示特征选择开始训练样本的预处理训练样本聚类计算中心点中心点与其它样本点组成新的训练集计算新样本与训练集样本的距离判断类别并计算相似度结束是否是否还有新样本取新样本图算法流程图实验结果与分析本实验中用到得数据集为数据库中的数据集,即数据集。此数据集有个样本,共分为三类。其中个样本作为训练集,剩余的个样本作为测试集。用本文算法通过实验得到结果如表示表算法实验结果类别该类总数正确判为该类的数判为该类的总数第类第二类第三类由上表可知召回率准确率当时,值之后本文算法分别与和算法进行了对比,其结果如表示表三种算法结果算法召回率准确率时,值分类时间复杂度,算法经典由表可知算法与传统算法
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
第 1 页 / 共 49 页
第 2 页 / 共 49 页
第 3 页 / 共 49 页
第 4 页 / 共 49 页
第 5 页 / 共 49 页
第 6 页 / 共 49 页
第 7 页 / 共 49 页
第 8 页 / 共 49 页
第 9 页 / 共 49 页
第 10 页 / 共 49 页
第 11 页 / 共 49 页
第 12 页 / 共 49 页
第 13 页 / 共 49 页
第 14 页 / 共 49 页
第 15 页 / 共 49 页
预览结束,还剩
34 页未读
阅读全文需用电脑访问
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。
1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。