doc 毕业论文_基于PARADISE平台的论文检索系统 ㊣ 精品文档 值得下载

🔯 格式:DOC | ❒ 页数:32 页 | ⭐收藏:0人 | ✔ 可以修改 | @ 版权投诉 | ❤️ 我的浏览 | 上传时间:2022-06-24 20:12

毕业论文_基于PARADISE平台的论文检索系统

文中每个句子影响程度的高低,显然,影响越大的句子,在别的文章中提及的越多,其分数就越高。最后,我们取定数量得分最高的句子,组成个段落,这个段落是对原文的个概括,而且会获摘要所不能获得的些信息。基于平台搭建搜索平台我们基于搜索引擎平台搭建成了个关于的全文搜索系统。由预处理,建立索引,检索,前台四部分组成。由于我们的数据是论文,并且已经转化为了文本格式,预处理这部就略去了,需要继承个建立索引的类,并且修改些前台的接口就可以了,这样就搭建成了个论文搜索系统。这过程也体现出了的可扩展性及易用性,中的每个组件都是可以通过继承个自定义的新类来完成的,其中包括预处理索引检索语言模型排序压缩等等所有的模块都可以自己选择或者自己重新定义来完成。实验的意义我们在读篇论文之前,般能简单的看到它的摘要作者等信息。而在读完篇论文之后,我们能获得什么信息呢主要有以下几种这篇文章做了什么事情,这可以从摘要中获得。这篇文章中涉及到的核心算法,这个只有在细致的读完了这篇文章之后才能理解,应该是没法依靠辅助来获得的。这篇文章哪些部分比较重要,哪些部分比较好,哪些部分需要改正,我们可以从哪些方向进行扩展。对于第三点,如果完全自己理解,可能会比较困难,而且对读者自己的要求也比较高,可能要读了很多这方面的背景知识后续论文等等才可能获得,而通过我们做的这个系统,就可以帮助大家更简单的获得些从文章中不能直接获得的信息。般来说,作者如果想从自己的角度归纳本文的大体内容,通过阅读摘要,我们可以看到作者写这篇文章大体做了什么。但是文章中很有可能有些作者没有发现,或者作者当前没有重视但是以后被别人发掘出来很重要的意义。通过将那些对文章进行引用的句子,与本文建模,对原文中的句子进行排序,从而获得文章中些有特殊意义,影响较大的句子,这样,我们可以获得文章中最重要的信息,而这些重要信息和摘要的区别就是,它们不是作者提出来的,而是别的作者在读了这篇文章以及其他的文章,经过很多思考之后,总结出来的这篇文章最重要的地方。此外,别的文章中对原文进行评论的句子,本身就是很重要的信息,可以让我们知道原文都做了哪些后续工作,或者哪些部分比较好,哪些部分需要改正。简单来说,我们这个系统的意义,就是通过数据挖掘的方法,获得些直接从原论文很难发现的信息,并且结合系统,以搜索引擎的方式呈现出来,便于大家检索查找。第章数据的收集我们这个系统的目的是为了方便读者理解论文,因此除了需要基本的论文的格式,还需要提取发表期刊作者摘要被引用次数,引用文章这些信息。其中,发表期刊作者以及被引用次数是用来在后面获得以及进行排序的时候加权用的,显而易见,较好的期刊,较有名的作者,引用次数较高的文章,它做出的评价应该要重要些当然,这里只是预留着为以后的扩展用,而我们的系统实际上并没有用到作者的知名度信息。当然,其中最重要的是提取引用的信息。我们的目标是通过获得每篇文章所引用过的文章,建立个映射表,然后将映射表倒置过来,从而获得每篇文章被哪些文章引用过。如何提取数据首先,是如何提取文章的摘要等各种信息了。本来我是准备直接从文章中提取的,随着工作的深入,发现这样做有很多的缺点,首先,从中提取各种信息就是个很繁重的工作,这本身就可以当做个毕业设计来做了,会消耗大量的时间,但却不定能够达到工作的目的其次,最重要的是,在每篇文章里,是以作者,文章名,发表期刊,年份的形式表现出来的,例如,而我们存储每篇文章的时候,是以期刊作为文件夹,以文章标题作文文件名来存储的,例如这篇论文,以下面的形式存储的。因此,我们需要从上面的那句话中提取会议名以及文章名,才能获得文章之间的引用关系,建立个表。这之中即使是相差个空格都不行,会直接导致整个系统的失败。于是,我们想出了个简单的办法。可以看到,在上,每篇论文的格式都是规整的,从上面可以很容易的提取出摘要文章名期刊等信息,可以下载到版的文件更重要的是,对于论文的引用信息,在该网页上给出了个超链接,点击之后就可以进入引用的文章的信息。因此,可以利用递归的方法,进入引用的文章,从中提取出会议名以及文章名,这样,每篇文章的引用北京高等教育出版社胡祝兵,基于单片机控制的直流电机调速系统的设计承德石油高等专科学校学报,马忠梅,单片机语言程序设计,北京航空航天大学出版社,陈涛编,单片机应用及程序设计,机械工业出版社贾玉瑛,王臣基于单片机控制的直流调速系统包头钢铁学院学报,黑龙江东方学院本科毕业论文设计附录附录系统程序接口定义黑龙江东方学院本科毕业论文设计液晶显示脚定义中断产生黑龙江东方学院本科毕业论文设计黑龙江东方学院本科毕业论文设计,延时黑龙江东方学院本科毕业论文设计初始化清屏使用位数据,显示两行,使用的字型显示器件,光标开,字符不闪烁字符不动,光标自动右移格中断单位时间方波个数速度显示的数据处理黑龙江东方学院本科毕业论文设计黑龙江东方学院本科毕业论文设计黑龙江东方学院本科毕业论文设计黑龙江东方学院本科毕业论文设计黑龙江东方学院本科毕业论文设计致谢在这里首先要感谢我的指导老师老师。王艳老师平日里工作繁多,但在我做毕业设计的每个阶段,从查阅资料到设计方案的确定和修改,中期检查,后期详细设计,程序等整个过程中都给予了我悉心的指导。我的设计较为复杂烦琐,但是老师仍然细心地纠正设计内容中的。除了敬佩老师的专业水平外,他的治学严谨和科学研究的精神也是我永远学习的榜样,他的循循善诱的教导和不拘格的思路也给予我无尽的启迪。并将积极影响我今后的学习和工作。其次要感谢我的同学对我无私的帮助。最后我要感谢我的母校黑龙江东方学院,是母校给我们提供了优良的学习环境另外,我还要感谢那些曾给我授过课的每位老师,是你们教会我专业知识。在此,我再说次谢谢,谢谢大家,本科生毕业论文题目基于平台的论文检索系统姓名学号院系信息科学技术学院专业计算机科学与技术系指导教师二〇六年六月二日摘要本文基于天网实验室的,搜索引擎平台,通过以从抓取的计算机网络方向的多篇论文为数据,搭建成个论文搜索系统,最终目的是通过论文之间的引用关系,获得其他引用这篇论文的作者对这篇论文的评价,形成个小的评价段落,以及,从而使得我们能够从专业级的角度获得这篇论文的内容以及优劣。我们首先从上面抓取了文章之间的引用关系,然后通过个算法获得对篇文章评价的候选句子集,根据这些句子的重要程度进行排序,获得个评价短文。并且构建了个语言模型,通过这些候选句子集对原文的句子进行评分,取得分最高的几个句子,获得原文基于影响的概括。关键词搜索引擎,论文评价,语言模型,算法,基于影响的概括目录第章引言研究背景工作内容抓取所需要的论文数据获得篇论文的评价并较好的显示出来获得篇论文基于影响的总结段落基于平台搭建搜索平台实验的意义第章数据的收集如何提取数据数据抓取的过程数据的存储及解析第章生成评论集获得评价的候选句子集获得评论段落第章建立模型并生成基于影响的概括建模之前我们所有的数据建模算法算法的实现获得基于影响的概括第章搭建搜索引擎结构简介修改索引部分修改前台部分系统示意图主界面搜索结果界面评论界面第章实验结果与分析实验结果具体分析第章后续工作第章致谢参考文献第章引言研究背景如今,全世界范围内学术活动日益积极,所产生的论文也在不断增多,因此,如何搜索到自己所需要的论文,以及自动获取些关于论文的信息,是客观需要的。学术检索,绝不简简单单的检索出所要查找的论文,这样就和普通的通用搜索引擎如等样了。学术检索,应该更侧重于深层次的内容挖掘。例如,可以通过篇论文所引用的文章以及所属领域,寻找出这个文章所在领域的主要论文,这对了解篇论文的背景知识以及理解个领域的发展非常重要。在中提到了文献检索现在主要的发展方向,有以下几点提高检索的质量,这是从语言模型的角度,让人们更加准确的找到所需要的论文。找到相关领域的最主要论文,以及些较权威的作者,帮助读者了解相关知识。从和角度,挖掘出些知识,最常见的,就是通过篇论文的被引用次数确定它的排名以及影响力。我们知道,国外的学生在第年的学习之后都是要通过考试的,考试的形式般是先读几十篇论文,然后根据这些论文的内容进行答辩。这时候,他们往往很想知道别人是如何评价这篇论文的,这篇论文有什么优点和缺点,有什么后续的研究等等。这就像我们准备去个地方旅游,不仅需要该景点本身的介绍有点类似于摘要,往往更想知道去过这个地方的人都是如何评价这些地方的。通过对这篇论文的评价,我们可以从更专业并且更加广阔的角度获得这篇论文的些信息,并且可以知道在这篇论文工作之后可以做哪些事情。基于上面的观点,我们就准备做出这样个知识提取系统,通过这个系统,可以自动获得别人对这篇论文的评价以及论文中的些较有影响力的信息,从而帮助人们更好的理解这篇论文。整体流程如图表所示。在,中,作者利用算法建立了个模型,生成了篇论文基于影响的概括,但是它并没有强调评论的重要性这里的评论,是指别的作者对它引用的篇文章的评论,它只讲评论当成个中间状态,当成个求得基于影响的概括的手段。实际上,这些评论和最终经过算法形成的概括是同等重要的,有时候,它甚至比后者更加清晰易懂。本文相对于,的优点是,赋予评论以及概括同等重要的意义,并且形成了个实际的系统供人使用,而不仅仅是用于研究。工作内容抓取所需要的论文数据要进行论文搜索,首先需要批实验数据,我是从上抓取下来的。之所以选择从这上面抓取,是因为我们不仅需要论文的文档,还需要从中自动提取摘要引用等信息,而这本身就应该是个挺复杂的算法了,而且不是我们工作的目的,而上述网站已经人工的将论文的摘要引用信息提取了出来,并且对于每个引用还有相应的链接,因此会节省我们抓取数据所要花费的工作量。最终我们将抓取的数据存储在中。获得篇论文的评价并较好的显示出来我们这个系统的主要工作是通过别的论文对原论文的评论,来获得些不能直接从原论文中获得的信息,因此,最基础的,就是如何获得这些评论。关于这点,我们通过上面的数据收集工作,会获得个论文之间的引用图,然后通过引用的倒置,能够获得引用篇论文的所有文章,然后,通过个算法,可以从这些文章中提取出对原文进行评价的句子。最终,为了便于使用者观看,还需要对这些

下一篇
毕业论文_基于PARADISE平台的论文检索系统第1页
1 页 / 共 32
毕业论文_基于PARADISE平台的论文检索系统第2页
2 页 / 共 32
毕业论文_基于PARADISE平台的论文检索系统第3页
3 页 / 共 32
毕业论文_基于PARADISE平台的论文检索系统第4页
4 页 / 共 32
毕业论文_基于PARADISE平台的论文检索系统第5页
5 页 / 共 32
毕业论文_基于PARADISE平台的论文检索系统第6页
6 页 / 共 32
毕业论文_基于PARADISE平台的论文检索系统第7页
7 页 / 共 32
毕业论文_基于PARADISE平台的论文检索系统第8页
8 页 / 共 32
毕业论文_基于PARADISE平台的论文检索系统第9页
9 页 / 共 32
毕业论文_基于PARADISE平台的论文检索系统第10页
10 页 / 共 32
毕业论文_基于PARADISE平台的论文检索系统第11页
11 页 / 共 32
毕业论文_基于PARADISE平台的论文检索系统第12页
12 页 / 共 32
毕业论文_基于PARADISE平台的论文检索系统第13页
13 页 / 共 32
毕业论文_基于PARADISE平台的论文检索系统第14页
14 页 / 共 32
毕业论文_基于PARADISE平台的论文检索系统第15页
15 页 / 共 32
温馨提示

1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。

2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。

3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。

4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。

5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。

  • 文档助手,定制查找
    精品 全部 DOC PPT RAR
换一批