帮帮文库

返回

毕业论文:HotData自动抽取模块的分析与设计 毕业论文:HotData自动抽取模块的分析与设计

格式:word 上传:2022-06-24 19:06:17
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
毕业论文:HotData自动抽取模块的分析与设计.doc预览图(1)
1 页 / 共 64
毕业论文:HotData自动抽取模块的分析与设计.doc预览图(2)
2 页 / 共 64
毕业论文:HotData自动抽取模块的分析与设计.doc预览图(3)
3 页 / 共 64
毕业论文:HotData自动抽取模块的分析与设计.doc预览图(4)
4 页 / 共 64
毕业论文:HotData自动抽取模块的分析与设计.doc预览图(5)
5 页 / 共 64
毕业论文:HotData自动抽取模块的分析与设计.doc预览图(6)
6 页 / 共 64
毕业论文:HotData自动抽取模块的分析与设计.doc预览图(7)
7 页 / 共 64
毕业论文:HotData自动抽取模块的分析与设计.doc预览图(8)
8 页 / 共 64
毕业论文:HotData自动抽取模块的分析与设计.doc预览图(9)
9 页 / 共 64
毕业论文:HotData自动抽取模块的分析与设计.doc预览图(10)
10 页 / 共 64
毕业论文:HotData自动抽取模块的分析与设计.doc预览图(11)
11 页 / 共 64
毕业论文:HotData自动抽取模块的分析与设计.doc预览图(12)
12 页 / 共 64
毕业论文:HotData自动抽取模块的分析与设计.doc预览图(13)
13 页 / 共 64
毕业论文:HotData自动抽取模块的分析与设计.doc预览图(14)
14 页 / 共 64
毕业论文:HotData自动抽取模块的分析与设计.doc预览图(15)
15 页 / 共 64

1、创建维护和导出个工程,并举例说明的分级策略。工程创建创建工程用户可通过以下三种方法在指定路径创建新的工程打开菜单选择使用快捷键点击快捷工具栏中的图标。进行以上操作后,将弹出创建工程向导,如图所示,在后输入保存路径点击可进行保存路径的浏览在后输入工程名称图创建工程向导点击,在指定路径创建工程目录目录结构见本节第三部分,同时,工程管理区中生成新的窗口,如图所示图新建工程窗口与窗口的区别在于仅显示查询结果以及经用户筛选得到的列表,旦关闭当前工程,所有的记录将被清空,无法恢复而窗口则显示已由添加至工程并下载到本地的信息,即使关闭当前工程,这些已被存储在文件中见本节第三部分的信息在重新打开时也可恢复。打开工程用户可通过以下三种方法打开已经存在的工程打开菜单选择使用快捷键点击快捷工具栏中的。

2、期刊进行调查,初步总结了的发布规律,如表所示杂志标准名称层次性标记语言附加数据注册改版表规律分析主要有以下特点层次性多数期刊的文献归档具有层次性,依次访问归档入口年归档卷期归档和附加数据归档或全文,便可到达的链接,少数期刊不具有层次性标记语言期刊归档网页的标记语言为或关键词在卷期归档或全文页面中,可以找到链接到附加数据归档的关键词,但每种杂志的关键词不同分散性与文献对应,由所属期刊维护,造成网页排版和数据形式多样时间限制大多只能在段时间内访问,近几年发表的需要注册才能访问网页改版同期刊可能存在归档页面改版现象。的分散性多样性以及时间限制等特点,向传统的自动抽取技术提出了挑战。曾有专家指出,所有发布在期刊网站中的应遵循共同的标准如标准,只有提出套成熟的发布标准,才能结束这种形式混乱的。

3、辑,浏览当前工程信息数据查询结果文摘信息以及的分级列表。此外,还提供浏览器和资源管理器的链接功能。图工程管理区下载管理区的下载控制区域,如图所示。用户将查询结果窗口中显示的添加到工程后,将自动将其添加到下载队列。在下载管理区中,用户可以对下载中的文件进行开始暂停停止删除任务等操作。图下载管理区控制台控制台将显示连接信息操作执行信息,工程运行信息等等,如图所示。信息的类型包括两种提示信息和信息。用户可以根据信息中的内容了解当前的执行状况及下载异常。图控制台工程管理采用对工程进行管理的方式来实现交互式的自动抽取功能。所有的查询筛选和下载操作,都是在用户建立的工程文件上进行编辑的。个工程具有结构化的目录见节,可存储数据日志工程属性数据信息和文摘信息等。本章将以期刊年卷第期为例,详细介绍如。

4、的文献归档中,主要包括数据内容和数据描述两部分。其中,数据内容是对文献内容的补充如基因组转录组蛋白质组和代谢组等方面的实验图谱及数据,可作为统计分析实验设计以及构建生物医学数据库的重要数据源数据描述则是对数据内容的概括及解释,具有关键词且分类性强。随着文本挖掘技术在生物信息学领域中的应用越来越广泛,研究人员利用自然语言处理技术,对大量生物医学文献的全文和摘要进行了分析,从而挖掘出隐含的生物学知识那么,如果将的描述与文献内容联系起来,作为文本挖掘的研究对象,可对隐含知识的挖掘提供有力的支持。因此,收集并对数据信息进行规范化的数据库管理,是项很有意义的工作。现状然而,目前在国际上尚未引起关注,对的相关研究也处于空白阶段,没有套成熟的发布收集管理和研究的标准。因此,我对本国际知名生物医学。

5、,建立个新的空工程窗口打开快捷键,打开已经保存在用户管理区中的工程关闭快捷键,关闭当前活动的工程窗口清除清除工程目录下临时文件夹中的文件属性打开参数设置菜单导出工程快捷键,将当前工程的数据导出到指定路径退出快捷键,退出主工作界面。菜单图菜单菜单提供了含有的生物医药杂志列表。菜单图菜单帮助内容快捷键,软件使用说明及常见问题解答关于显示的版本信息。快捷工具栏图快捷工具栏建立个新的空项目窗口打开已经保存在用户管理区中的项目关闭当前活动的项目窗口清除工程目录下临时文件夹中的文件打开参数设置菜单将当前工程的数据导出到指定路径软件使用说明及常见问题解答显示的版本信息退出主工作界面。工程管理区的工程编辑区域,如图所示。用户打开或新建个工程后,可在工程管理区进行编。

6、标。进行以上操作后,将弹出路径浏览窗口,用户选择扩展名为的工程文件即可打开工程。工程目录个工程具有结构化的目录当用户新建个工程后,将在工作目录下生成个工程文件和个工程目录工程目录下包含工程属性目录,临时文件目录,数据存放目录和日志文件目录工程属性目录下包含连接属性文件日志属性文件和工程属性文件数据存放目录下包含数据信息文件临时文件目录与日志文件目录为空随着用户对工程的维护,临时文件目录将存放用作解析的网页源文件以及用于获取文摘信息的文件下载至本地的将按数据信息以及的形式生成文件夹,存储在数据存放目录下日志文件目录存放按日期命名的日志文件。目录结构如图所示工作目录工程文件工程目录工程属性目录临时文件目录数据存放目录日志文件目录连接属性文件日志属性文件工程属性文件期刊归档页面。

7、面。不过,的层次性标记语言以及关键词等优势,可为编程人员所利用,开发出相应的抽取转换和加载软件,最终建立公共数据库,供研究人员访问。模块的分析与设计需求分析由的现状可知,数据的收集是进行切研究的前提。随着越来越多的出现在期刊网站中,手工下载显然无法适应研究的需要。只有开发出自动抽取模块,以计算机为工具将从自治的数据源中抽取到本地,才能进行下步的规范化管理。但是,半结构化的网页数据存在着大量和冗余,若仅依靠计算机程序的判断,则难以保证抽取的正确性,因此需要引入人工判断。个成熟的自动抽取模块应具有以下功能及特点提供交互式的操作界面,实现半自动化的抽取提供归档查询的功能,根据用户的选择,可从期刊的文献中解析出的提供附加数据页面浏览功能,辅助用户筛选可进行下载控制,将数据存储至本地可获取对。

8、由此而产生的法律责任和法律后果,特此郑重声明。学位论文作者签名年月日摘要目录引言随着生物医学研究技术的进步,高通量实验产生了大规模有意义的数据。在学术期刊以文献形式公布研究成果时,需要通过不同的途径来公布这些数据,其中文献的附加数据,也称作补充材料,是最普遍的方式。附加数据以电子格式发布在期刊网站的文献归档中,其数据内容和数据描述是进行统计分析和文本挖掘的重要数据源。充分有效的利用这些资源,进行研究实验以促进生物学和生物信息学的发展,显得非常必要。然而,附加数据在国际上尚未引起关注,相关研究也处于空白阶段。为了对附加数据进行系统研究,上海生物信息技术研究中心根据其特点,提出了热点数据的概念,它的含义为由生物医学期刊以电子格式在网站上发布,作为科技文献内容的补充说明,且访问时间具有定。

9、应的文摘信息为以后数据导入主题数据库提供支持将所有查询浏览筛选下载等操作以工程项目的形式串联在起,进行规范化管理软件需通过大量测试,运行稳定且易维护。的应用定义开发软件,是本课题的最终目标,若要实现需求分文件打开方式选择程序设置始终使用选择的程序打开这种文件确定,如图所示。图打开方式设置环境设置在安装和后,用户需要手动设置系统变量,即虚拟机的安装目录然后,在系统变量中增加的路径,如图所示图环境变量设置软件界面的主界面包括菜单与工具栏工程管理区下载管理区和控制台,共个主要部分。各部分在主界面中的位置如图所示图主界面菜单与工具栏主菜单包括和三个部分,如图所示。通过选择菜单使用其中定义的快捷键以及点击工具栏图标,用户可以完成对工程的创建编辑和导出等操作。图菜单与工具栏菜单图菜单新建快捷。

10、目与中的标准文章题目相匹配,最终获取对应文章的文摘信息,与相关联。返回的查询结果将在窗口中显示,每条记录包含以下信息分类号密级编号武汉大学硕士学位论文论文题目与上行间隔为毫米以上二行用宋体标号字自动抽取模块的分析与设计研究生姓名指导教师姓名职称学科专业名称研究方向以上四项用宋体标号字此处间隔为毫米年月日年月日用黑体标号字地脚留出毫米空白边缘为了加强学风学术道德建设,规范学术行为,提高学位论文质量,确保学位授予的权威性严肃性,学校对学位论文撰写作如下补充规定凡申请学位人员须对自己的学位论文负责,在提交的学位论文的英文题目后页中文摘要前页增设页书面声明,内容如下郑重声明本人的学位论文是在导师指导下撰写并完成的,学位论文没有剽窃抄袭造假等违反学术道德学术规范和侵权行为,否则,本人愿意承担。

11、制的附加数据。此概念着重强调了附加数据的访问时间限制性,因此数据的收集整理成为亟待解决的问题。本文总结了的发布规律及数据形式,它的分散性多样性以及时间限制等特点,向传统的自动抽取技术提出了挑战。不过,通过利用的层次性标记语言以及关键词等优势,能够将期刊之间的差异逐渐缩小,以套通用的方案解决自动抽取问题,最终采用为开发平台,技术为工具,开发出自动抽取模块,即软件。是以抽取转换和加载为目的而设计开发的软件,它应用数据仓库技术中常用的工具成功解决了的收集整理问题,主要步骤包括数据抽取解决与信息的获取问题实现的解析文摘信息的获取和的下载等功能。数据转换解决与信息形式混乱的问题实现工程目录结构化管理信息标准化分级管理以及用户筛选列表等功能,与抽取部分结合紧密。数据加载为以后导入主题数据库提供。

12、源码年归档页面源码卷期页面源码文件数据信息文件数据存放目录日志文件日志文件图工程目录结构图工程维护添加归档选择打开菜单选择期刊名称,如表所示所属机构杂志名称表杂志列表若选择查询,将根据期刊名得到,将归档页面的源文件下载到工程目录下的临时文件夹下,文件名为,即期刊名系统年份,系统年份年更新次。从可以解析出的所有年份,在归档选择向导中显示。如图所示,分别代表年卷期图归档选择向导若用户选择年,会将年归档页面源文件下载到目录下,文件名为,即期刊名期刊年其中转换为。从可解析出年的所有卷期,返回供用户选择。若用户选择卷第期,会将此卷期归档的页面源文件下载到目录下,文件名为。点击,查询信息。文摘信息获取系统从下载到文件夹中的的卷期归档源文件解析出卷号期号,从下载名为的文件。将中解析出来的文章。

参考资料:

[1]毕业论文:HL净水器品牌营销策略研究(第80页,发表于2022-06-24)

[2]毕业论文:HJC5256GJB混凝土搅拌运输车焊接(第16页,发表于2022-06-24)

[3]毕业论文:HG市某污水处理厂设计(第47页,发表于2022-06-24)

[4]毕业论文:HFC网络宽带综合业务通信(第57页,发表于2022-06-24)

[5]毕业论文:HDPE模压发泡配方工艺的研究2(第15页,发表于2022-06-24)

[6]毕业论文:HDPE模压发泡工艺及配方的研究2(第12页,发表于2022-06-24)

[7]毕业论文:HCV核心区基因片段C70-140的原核表达(第22页,发表于2022-06-24)

[8]毕业论文:HART协议智能差压变送器设计(第33页,发表于2022-06-24)

[9]毕业论文:H194数控磨床改造——零件加工程序设计(第23页,发表于2022-06-24)

[10]毕业论文:H.264编码算法优化及其在视频监控中的应用(第75页,发表于2022-06-24)

[11]毕业论文:G网和W网室内信号覆盖平面方案设计(第47页,发表于2022-06-24)

[12]毕业论文:GSM无线网络优化(第46页,发表于2022-06-24)

[13]毕业论文:GSM技术的远程分布式温度采集系统(第39页,发表于2022-06-24)

[14]毕业论文:GSM手机的维修技巧(第21页,发表于2022-06-24)

[15]毕业论文:GSM-R系统在CTCS-3中的应用初探(第26页,发表于2022-06-24)

[16]毕业论文:GSM-R在铁路通信中的应用(第50页,发表于2022-06-24)

[17]毕业论文:GSH对低温胁迫下枇杷幼果叶绿体(第8页,发表于2022-06-24)

[18]毕业论文:GPS高程测量的理论与方法研究(第22页,发表于2022-06-24)

[19]毕业论文:GPS高程测量及高程拟合研究论文(第79页,发表于2022-06-24)

[20]毕业论文:GPS测量及数据处理(第21页,发表于2022-06-24)

预览结束,还剩 49 页未读
阅读全文需用电脑访问
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。

2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。

3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。

4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。

5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。

毕业论文:HotData自动抽取模块的分析与设计
帮帮文库
页面跳转中,请稍等....
帮帮文库

搜索

客服

足迹

下载文档