doc 毕业论文_基于文本的聚类算法研究 ㊣ 精品文档 值得下载

🔯 格式:DOC | ❒ 页数:33 页 | ⭐收藏:0人 | ✔ 可以修改 | @ 版权投诉 | ❤️ 我的浏览 | 上传时间:2022-06-24 20:12

毕业论文_基于文本的聚类算法研究

数据上的聚类分析研究,较早的综合性介绍可以追溯到在领域的经典书籍中提到的利用文本聚类分析技术来提高信息检索系统的准确率,但近年来此类研究已不多见。上个世纪年代以来,文本的聚类分析技术研究更多地集中在对大规模的文档集合的浏览上在对用户提出的查询重新组织搜索引擎的查询结果的研究中利用聚类技术重新组织文档集合,用于文档集合的浏览,这是近年来文本聚类中个广受关注的研究点,年上推出的技术代表了此类应用研究目前最新的进展。在此类研究中,主要利用或者后缀树聚类算法的变种来实现其需求。文档聚类分析算法被用于自动产生文档集合的层次结构,比如用于产生类似,的网页分类目录结构。近年来,文档聚类算法还在文档分析处理领域中个新的应用方向话题检测与跟踪中得到了进步研究与应用。话题检测中利用文档聚类算法从大量的文档中自动地抽取话题,应用于个性化信息服务或者情报分析。在这些应用的推动之下,文本数据上的聚类分析算法层出不穷,各说各的好处,在我们的工程实践中具体该采用哪种算法,如何设计文本聚类算法并对其进行评价都是难以解决的问题。由于算法种类众多,文本聚类算法间缺乏个进行横向比较与分析的机制,在工程实践中对算法的选择及参数的设定都是经验性的,这对进步开展研究以及科学地设计算法分析算法造成了困难。因此,需要对文本聚类分析结果的质量进行评价,利用这种评价机制来指导算法设计算法选择算法效能分析参数优化等。有了文本聚类分析的科学评价机制,我们未来的工作就有据可依,可以更科学地选择算法,分析设计算法。基于文本的聚类算法研究第二章文本聚类效果影响因素文本聚类过程影响文本聚类分析效果的因素是多方面的,文本聚类分析全过程中的每个步骤都有可能对聚类结果造成影响。下面通过简要描述聚类分析过程来说明对结果可能造成影响的各种因素,如图所示图聚类流程聚类分析过程分成三个步骤,通过这三个步骤可以找到影响聚类分析效果四个方面的因素。聚类流程三个步骤的实际处理内容为文本聚类分析首先将文本表示成机器可计算的形式。不论是抽取文本特征形成个向量还是抽取文本特征形成个特殊的结构,对文本的这种机器表示过程简称为文本表示。文本表示过程显然需要领域知识参与,文本中哪些因素可以构成特征,特征中哪些在聚类中可用以及如何使用是文本聚类第步骤文本表示考察的内容基于文本的聚类算法研究文本聚类分析的第二个步骤是算法。不同的算法有不同的特性,对相同的数据输入,不同的算法会产生出不同的聚类结果。聚类分析算法可以从不同的角度进行比较,比如是否产生层次聚类结构是否需要参数是否能够产生模糊聚类能否识别出不规则形状的簇等等。目前在文献中出现的聚类分析算法数目众多,但在文本数据上效果孰优孰劣仍没有得到有效的研究。这个步骤中算法的时空效率聚类结果质量是研发中选择算法的主要标准。该步骤还有个关键因素就是对象距离或者相似度如何定义第三个步骤是算法中参数的选择。不同的算法对参数的敏感性不同,但是基本上参数的好坏对结果的影响都比较显著。从这三个步骤可以看出影响文本聚类分析效果的因素包括四个方面文本表示模型距离度量方法算法模型和参数优化。参数的设定主观性比较强,如何设定才是个好的参数缺乏有效的方法,利用本文中实现的聚类算法包和聚类评价方法可以通过指标的变化曲线图寻找算法的最佳参数。文本表示模型在实际的文本聚类分析研究,将实际文本内容变成机器内部表示结构的方法多种多样,可以用词字短语显著性短语等形成向量树等结构。在经典的研究中通常利用特征,包括字词词组等的词频信息建立文本向量,通过文本向量与文本向量之间的相似度来进行聚类分析。文本表示包括两个问题表示与计算。表示特指特征的提取,计算指权重的定义和语义相似度的定义。特征提取包括特征的定义和筛选,特征定义和筛选考虑以什么作为文本的特征,并不是所有的词和字都要求或者可以成为特征。特征的权重定义及特征结构上的相似度度量可以选取不同的模型,如向量空间模型概率模型语言模型等。文本表示是文本聚类的第步,该步骤的变化很多,对最终聚类效果的影响也不尽相同。文本表示本质上是对原始文本进行转换,使之在机器上可形式化描述可计算。特征定义与筛选可以采用不同的特征选择方法,可利用树提取特征可利用降维转化特征也可利用语义词典基于文本的聚类算法研究或者定义更复杂的特征结构。关于特征定义与筛选可以参考自然语言处理领域中的相关研究,这里不详细介绍。本节接下来主要介绍信息检索和文本分析处理中经常用到的几个检索模型,这几个检索模型根据不同的理论假设推导定义了不同的特征权重计算方法与语。是旅游观光,科学考察的理想去处。向海的四大生态景观可给人们提供天然的娱乐场所。随着全球范围内旅游业的振兴,向海生态旅游业的发展方兴未艾。现已具备接待现代旅游的服务条件。 向海湿地野生动植物资源的开发利用 保护区生物多样性丰富是种群数量丰富二是基因多样,仅榆树基因就有黄榆春榆家榆等多种三是生境多样,荒漠生境森林生 境沼泽生境水体生境交错分布。依据拉姆萨尔公约,向海境内分布有淡水湖泊及相邻沼泽地沼泽地及小型淡水池塘内陆水系及相邻咸水沼泽水库人工湖和季节性洼水草甸草地等六种主要湿地类型 向海自然保护区水生植被丰富,有许多种漂浮植物浮水根植物沉水植物和挺水植物。大量的藻类是鱼类丰富的食物,同时浮游生物和鱼类又是水禽良好的饵料。大面积的芦苇沼泽为栖息和繁殖在这里的水禽提供了隐蔽的场所。低洼地的草甸和草甸草原,分布有大量的草本植物,是当地居民放牧的地区。交错在湖泊和草甸之间白城师范学院本科毕业 论文 是起伏的沙丘,在沙丘上长有天然的 榆树林。 对向海湿地农业观光品尝的开发利用 向海湿地,作为国家 级旅游景区,目前正加强生态环境保护,加快向海景区的管理体制和运营机制。进行科学规划旅游景区,朝着加快绿色生态旅游资源开发迈进。向海湿地农作物向观光农业发展,并逐步被开发利用。 白城师范学院本科毕业 论文 向海湿地生态资源开发利用存在的问题 向海湿地生态环境脆弱,水资源缺乏 向海湿地水源主要依靠境内的 条河流。霍林河额穆泰河和洮儿河引水工程。额穆泰河水量极小,十年九枯。霍林河水源丰富,但季节性强,丰水期水量大,下泄快,储在湿地的水量不大。向海湿地自 年嫩江流域大 洪水过后,连续多年干旱,造成向海湿地大面积无水,原有的 个湖泊泡沼多数干枯。芦苇蒲草等主要湿地植物急剧退化演替,大批候鸟无栖身之地,土壤沙化和盐碱化日趋严重,大批候鸟栖身之地受到严重破坏。 湿地面积萎缩,生态调蓄功能减弱,湿地污染加剧 自然方面由于向海自然保护区常年气候干旱及盲目的湿地开垦和改造使湿地面积萎缩水资源生态调蓄功能减弱, 社会方面由于人口的增长和 经济 的 发展 ,湿地围垦淤积过度开发利用及各种污染严重,天然湿地急剧减少,湿地功能和效益不断下降,湿地资源保护面临严重威胁,对湿地的水生态环境也造成很大影响。 经济贫穷文化落后,气候条件差 向海自然保护区属北温带大陆性季风气候,处于吉林省半干旱草原地带。春季多风干旱,夏季温暖。冬季严寒少雪,风沙较多,大陆性显著,年平均气温 ,最高年平均蒸发量远大于降水量全年盛行西南风,风速般 级,最大风速可达 级, 级以上大风平均 天。保护区文化相对落后,居民 综合素质低,环保意识差,这两个因素共同影响了湿地的开发与保护。 湿地生态系统破碎化,栖息生境安全受到威胁,生物多样性下降 向海自然保护区是典型的湿地类型的自然保护区,区内生境复杂多样,鸟类资源十分丰富。近年来,由于持续的干旱,湿地面积锐减,水鸟栖息地严重丧失或缺乏,水鸟种类数量变化明显。湿地生态环境的恶化,使得生态系统逐步趋向破碎化,严重影响了野生动物的生存环境,很多鸟类濒临灭亡。 国民的湿地保护意识薄弱,公众参与不够 保护区内居民环保意识薄弱,农民放牧乱开荒,严重地破坏了向海的生态。如今保护区内不少 原来的湿地已变成了干地,许多地方米以下的榆树幼林被山羊吃得精白城师范学院本科毕业 论文 光,不仅使鸟类失去筑巢栖息的环境,同时还造成土地进步沙化,地面蓄水功能削弱,野生动物的生存受到极大危胁,纷纷离家出走。重点是加强各级领导干部湿地保护管理人员湿地开发利用者当地社区人员及青少年和行政执法人员的湿地保护与合理利用的意识教育。从科学的角度用科学的方法,让人们了解和认识湿地与人类的关系。要将宣传教育的目标群体逐步从城市转向农村,把湿地保护与合理利用知识传授到每家每户,让湿地利用者逐步掌握湿地保护与合理利用的基本常识。应力求 将湿地保护与合理利用的内容列入到教育计划或课外实践活动,以此提高全社会对湿地的保护意识。针对宣教对象的不同,设计多种形式的活动,提高宣传效果,利用世界湿地日爱鸟周等活动,在全省范围内开展多种形式的宣传活动,进步提高全社会湿地保护意识。 白城师范学院本科毕业 论文 向海湿地资源保护与管理 开展科研活动 加强湿地的科学研究,是认识和了解湿地的主要途径,也是促进湿地保护和可持续利用发展的保证。要充分发挥我省科研教学单位的优势,集中力量,共同攻关,对西部湿地类型特征功能价值动态变化等,进行较为全面深入系统的研究,为湿地的保护和合理利用奠定科学基础。建成了办公室招待所标本室宣教中心大楼等保护管理的基础设施完成了保护区的功能区划和总体规划确定了保护区的发展目标和长远目标,并采取了些卓有成效的保护措施。通过组织参观野生动物宣教中心印制画册图片以及录制专题片等方式广泛地在社区范围内向人民群众进行了宣传,使群众提高了认识,自觉爱护野生动物,理解了环保的意义及公民对生态保护的责任和义务。 科学地划分了生态功能区 我们委托国家林业局调查设计院在保护区进行了详细地科学地区划,划分出核心区缓冲区和试验区,制定了各功 能分区的管理标准,为保护区的依法保护和经营管理提供了可靠的依据。 加强水资源人为调控,排洪与灌溉相结合,保证湿地用水 吉林省西部属水资源欠发达地区,水资源总量不是十分丰富。这就给湿地保护增加了新的难题。因此,在建立全省生态水利资源水利效益水利的过程中,要有规划地保证各类主要湿地的补水量,以解决湿地水资源短缺问题 向海湿地起着均化洪水的作用,主要体现在水库的分洪和芦苇湿地的削减洪峰两方面。修建水库,加强水资源的认为控制,可以有效利用水源。由于湿地面积的萎缩和湿地蓄水功能的减弱导致洪涝灾害频繁发生。排洪的同时 ,结合排洪工程,在适合的地段修建水库引水灌溉工程,可使排洪与灌溉有机结合。目前修建的霍林河分洪入向工程,可将灾害的洪水变为有用的资源,既减轻灾害又有效地利用了宝贵的水资源。 实行社区联防,齐抓共管 为了更好地做好保护工作我们吸收区内乡镇场的主要领导成立了联合保白城师范学院本科毕业 论文 护委员会,共同研究环境保护中取得的成绩存在的问题,在平衡各方面利益,保护

下一篇
毕业论文_基于文本的聚类算法研究第1页
1 页 / 共 33
毕业论文_基于文本的聚类算法研究第2页
2 页 / 共 33
毕业论文_基于文本的聚类算法研究第3页
3 页 / 共 33
毕业论文_基于文本的聚类算法研究第4页
4 页 / 共 33
毕业论文_基于文本的聚类算法研究第5页
5 页 / 共 33
毕业论文_基于文本的聚类算法研究第6页
6 页 / 共 33
毕业论文_基于文本的聚类算法研究第7页
7 页 / 共 33
毕业论文_基于文本的聚类算法研究第8页
8 页 / 共 33
毕业论文_基于文本的聚类算法研究第9页
9 页 / 共 33
毕业论文_基于文本的聚类算法研究第10页
10 页 / 共 33
毕业论文_基于文本的聚类算法研究第11页
11 页 / 共 33
毕业论文_基于文本的聚类算法研究第12页
12 页 / 共 33
毕业论文_基于文本的聚类算法研究第13页
13 页 / 共 33
毕业论文_基于文本的聚类算法研究第14页
14 页 / 共 33
毕业论文_基于文本的聚类算法研究第15页
15 页 / 共 33
温馨提示

1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。

2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。

3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。

4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。

5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。

  • 文档助手,定制查找
    精品 全部 DOC PPT RAR
换一批