帮帮文库

毕业论文:专家检索研究综述 毕业论文:专家检索研究综述

格式:DOC | 上传时间:2022-06-24 19:06 | 页数:25 页 | ✔ 可以修改 | @ 版权投诉 | ❤ 我的浏览
毕业论文:专家检索研究综述
毕业论文:专家检索研究综述
1 页 / 共 25
毕业论文:专家检索研究综述
毕业论文:专家检索研究综述
2 页 / 共 25
毕业论文:专家检索研究综述
毕业论文:专家检索研究综述
3 页 / 共 25
毕业论文:专家检索研究综述
毕业论文:专家检索研究综述
4 页 / 共 25
毕业论文:专家检索研究综述
毕业论文:专家检索研究综述
5 页 / 共 25
毕业论文:专家检索研究综述
毕业论文:专家检索研究综述
6 页 / 共 25
毕业论文:专家检索研究综述
毕业论文:专家检索研究综述
7 页 / 共 25
毕业论文:专家检索研究综述
毕业论文:专家检索研究综述
8 页 / 共 25
毕业论文:专家检索研究综述
毕业论文:专家检索研究综述
9 页 / 共 25
毕业论文:专家检索研究综述
毕业论文:专家检索研究综述
10 页 / 共 25
毕业论文:专家检索研究综述
毕业论文:专家检索研究综述
11 页 / 共 25
毕业论文:专家检索研究综述
毕业论文:专家检索研究综述
12 页 / 共 25
毕业论文:专家检索研究综述
毕业论文:专家检索研究综述
13 页 / 共 25
毕业论文:专家检索研究综述
毕业论文:专家检索研究综述
14 页 / 共 25
毕业论文:专家检索研究综述
毕业论文:专家检索研究综述
15 页 / 共 25

1、索方法,但该方法将每个文档同等对待,缺乏可行性。等在年提出的利用资源描述框架构建专家档案的方法也可归为此类。在上,些参与者就采用了创建专家档案的方法等通过给专家在个人主页,邮件线程,语料库中的出现频次加权来建立专家档案。等提出了种文档重组方法,该方法能识别各种对候选专家的描述,重组来自不同媒体格式的相关信息,形成候选专家的档案,且证明了建立专家档案能够减少用户查询的空间。等通过文档集如该专家所发送的邮件来表示候选专家,再通过不同信息检索模型向量空间模型和隐语义模型来计算文档集与检索主题之间的相似性。等根据每个候选专家的姓名和邮件地址来抽取专家信息,然后依据这些信息给每个候选专家建立档案,其实验结果显示,其检索性能好坏关键取决于识别专家姓名的能力。年,在参加的专家检。

2、找具有专长的专家和查找专家所具有的专长。目前,检索界所探讨的专家检索般是指前个方面。本文所探讨的专家检索也是指查找具有专长的专家,故本文中的专家检索主要任务可以描述为利用企业或者组织内外能够表征专家专长的各种文档和资源,如电子邮件报告数据库文件和网页等,识别专家在给定查询主题领域的专长相关性程度,并按程度高低排序显示专家结果列表的过程。本文组织如下第二节介绍用于专家检索的数据集来源,第三节介绍专家检索的方法,第四节介绍专家检索排序,第五节介绍专家检索结果的评价,最后第六节对本文工作进行简要总结。专家检索的数据集来源般来说,要实现专家检索需要两个必要条件即专家列表和包含专家专长信息的数据集。其中,数据集来源可以分为以下三类传统数据库专家检索的最初数据来源就是在组织中。

3、专家检索系统。等通过电子邮件交互提取出个专家网络,并通过该网络寻找具有相同兴趣或专长的专家。等利用讨论组中专家的交流提出了种具备专家推荐能力的智能中介来向讨论组中的询问者推荐可解答问题的专家。等和等分别利用专家访问互联网的日志和专家访问本地文件的日志,结合被访问网页和文档的主题,来实现类似于专家检索的功能。等通过对公司内部网络中的文档和专家建立联系,提取专家专长的表示,从而实现专家检索。等提出了种利用资源描述框架描述专长的形式,并利用了高等院校中常见的专长资源专家主页学术文献科技报告来检索专家。目前,在专家检索领域仍没有种通用的方法,通过分析近几年来专家检索任务中采用的方法,本文将近几年来参与者所采用的方法分为以下四类基于专家档案的方法基于文档的方法基于窗口的方法。

4、,在候选专家列表中包括了专家的全名和邮件地址。语料库和的数据集,是于年月从的公开网站上抓取的。该数据集共,包括了个文档,含个超链接,其中的网页至少包含个外链接,且这些外链接包含锚文本。等指出,中大约的文档是网页,的文档是和格式的,剩下的文档则是多媒体和等格式的。没有给参与者提供候选专家列表,而只是提供了员工邮件地址的个模板如,所以参与者需在数据集中识别出专家的特征信息如姓名与邮件地址。外部数据源语料库和语料库中的数据集都是企业内部网站上抓取的但基于这样的个假设,真正的专家不应该只是在企业或者组织内部有名望,其在可查询到的网络空间如新闻,博客,学术图书馆中也可能具有定的声誉。以来,研究者们尝试扩展数据集的来源,即从企业内部网扩展到互联网。也就是说在建立专家档案时不但。

5、或专长的专家。等利用讨论组中专家的交流提出了种具备专家推荐能力的智能中介来向讨论组中的询问者推荐可解答问题的专家。等和等分别利用专家访问互联网的日志和专家访问本地文件的日志,结合被访问网页和文档的主题,来实现类似于专家检索的功能。等通过对公司内部网络中的文档和专家建立联系,提取专家专长的表示,从而实现专家检索。等提出了种利用资源描述框架描述专长的形式,并利用了高等院校中常见的专长资源专家主页学术文献科技报告来检索专家。目前,在专家检索领域仍没有种通用的方法,通过分析近几年来专家检索任务中采用的方法,本文将近几年来参与者所采用的方法分为以下四类基于专家档案的方法基于文档的方法基于窗口的方法和基于图的方法。基于专家档案的专家检索抓取所得数据集合信息抽取建立索引检索并排。

6、用个数据库存贮每个候选专家的技能和知识,这些信息都是用户手动添加进去的,其存在以下缺陷首先,该数据库需要受手动创建和维护,因此费时费力其次,专家的专长信息是不断更新的,而数据却不易更新,故数据库的信息往往是陈旧的再者,利用这些数据库进行专家检索时对查询格式有固定的格式化要求,缺乏灵活性。企业内部网从企业的内部公开网站上获得的企业内部网页企业内部邮件企业内部文档简历个人主页等可以作为专家专长信息的来源。如为专家检索子任务提供了两种数据集,即语料库和语料库,它们都来自于企业内部网站。语料库和使用的专家检索数据集是在年月从的公开网站上抓取的,其数据集的详细信息如表所示表数据集类型范围大小文档数平均文档长度此外,在这两次的专家检索任务中,给参与者提供了包含个候选专家的列表。

7、索任务中,提出了专家语言模型,利用信息检索中的语言模型计算专家档案产生查询的概率,以此来给专家排序。等在基于社区的问答服务中研究了专家检索。并通过构建不同大小的专家档案来进行研究,最后他们得出这样的结论,专家档案中包含的专家证据越多则越能提高检索性能。和在构建专家档案时,根据文档的格式将其分组,并依据每组中文档对专家档案的贡献给文档加权。和将专家档案分为两部分,即包括专家所擅长领域的主题档案和包括专家合作网络的社会档案,且在给每个候选专家建立档案时进行了过滤,当该专家在个学科领域里是排名靠前的专家时,该学科领域才被包含在该专家的档案中,这就使得在检索时可以返回该领域较有名气的专家,从而减少了冗余度,但也使得漏检的概,fi,,fififi,fi,,fi,,,,专家检索研究综述摘。

8、要增加了企业检索任务并设立了专家检索子任务,为专家检索方法和技术的经验性评价提供了平台,并着重从专家检索算法模型和评价方法等几方面进行了探讨,极大地促进了专家检索研究的发展。本文即是在此背景下,对近年来专家检索研究的进展和现状进行的系统总结。本文分别从专家检索的数据集来源专家检索方法专家检索的排序方法专家检索的效果评价这四个方面对专家检索的相关研究进行了介绍和评述。关键词专家专家专长专家档案专家证据专家检索,引言进入世纪,人类社会正在由信息社会迈向知识社会,掌握定知识经验和技能的人才将会成为企业和组织最宝贵的资源。各领域的专家是该领域知识的代表,所拥有的丰富且最新的该领域的专业知识技能和经验是企业生存和发展的最关键因素。目前,些企业和组织,为了提高自身的竞争优势,。

9、外所获得的专家证据来源称之为外部数据源。如些学术数据库,专利网站或者新闻网站等,都是专家证据的很好来源。等利用检索出候选专家的出版物来补充专家档案中候选专家的专长信息等将整个互联网作为专家证据的来源。等创建了数据集,该数据集是从荷兰蒂尔堡大学网站抓取的多语种信息,获得了多语种的专家证据。等利用搜索引擎搜索专家或者专家的相关信息,并将搜索引擎的返回结果作为专家证据的外部数据集。专家检索方法早在年会议设立专家检索任务之前,其它领域的学者们已对专家检索方法进行了探讨,但并未在检索学界得到较多的关注。早在年,等就通过潜语义标引对研究团体的研究成果文献建立索引作为团体专长的种描述,从而实现自动化的专家检索系统。等通过电子邮件交互提取出个专家网络,并通过该网络寻找具有相同兴趣。

10、序与各主题相关的专家列表查询主题专家候选人特征信息姓名电子邮箱等各专家候选人个人描述索引结果集邮件数据库记录文档报告网页„„图基于专家档案的专家检索流程基于专家档案的专家检索的大体思想是专家的专长可以通过用些词语来描述,从各种异构的数据集中抽取出描述专家专长的词,构成对候选专家的个人描述文档。图描述的是基于专家档案法的专家检索流程图,从该图中可知先从各种数据集合中抽取与专家相关的信息,构建各候选专家的个人描述文档,然后对这些描述文档建立索引,最后根据查询主题对这些文档进行排序,从而可得到候选专家的专长得分。等在年提出用每个专家所在文档中的词语组合成个虚拟文档该文档包含了候选专家的知识,最后利用传统的信息检索方法给这些虚拟文档排序。这种方法可以被归为基于档案的专家检。

11、要考虑企业内部网上的专家证据也要考虑外部网站上的专家证据。把这些从企业内部网之外所获得的专家证据来源称之为外部数据源。如些学术数据库,专利网站或者新闻网站等,都是专家证据的很好来源。等利用检索出候选专家的出版物来补充专家档案中候选专家的专长信息等将整个互联网作为专家证据的来源。等创建了数据集,该数据集是从荷兰蒂尔堡大学网站抓取的多语种信息,获得了多语种的专家证据。等利用搜索引擎搜索专家或者专家的相关信息,并将搜索引擎的返回结果作为专家证据的外部数据集。专家检索方法早在年会议设立专家检索任务之前,其它领域的学者们已对专家检索方法进行了探讨,但并未在检索学界得到较多的关注。早在年,等就通过潜语义标引对研究团体的研究成果文献建立索引作为团体专长的种描述,从而实现自动化的。

12、经或者正在建立专家检索系统,利于有效地管理专家资源。专家检索亦称之为专家查询,专家推荐,专长定位,专长识别作为实体检索的个特例,它要求返回的实体类型是具有特定专长与查询主题相关的的专家。由于专家检索在促进知识共享和交流,构建学术界和产业界的桥梁,知识管理等方面有重要的应用价值,近年来专家检索引起了学术界广泛兴趣。作为的后继项目,于年增加了企业检索任务,并设立了专家检索子任务。该子任务可以描述为给定文档集,查询主题集和专家列表,并从这些专家列表中为每个查询主题查找相关专家。自设立专家检索子任务后,为专家检索的方法和技术进行经验性评价提供了个公共平台,近几年来,分别对专家检索算法模型和评价进行了探讨,促进了专家检索领域的发展。关于专家检索的任务,等界定为以下两个方面查。

参考资料:

[1]毕业论文:《城市社区养老服务的现状及问题分析(第14页,发表于2022-06-24 19:19)

[2]毕业论文:《呼啸山庄》中希斯克里夫和凯瑟琳的爱情悲剧分析(第16页,发表于2022-06-24 19:19)

[3]毕业论文:《单片机模拟电梯控制系统》文献综述(第27页,发表于2022-06-24 19:19)

[4]毕业论文:《利用影响力受贿罪“关系密切的人”之界定》(第12页,发表于2022-06-24 19:19)

[5]毕业论文:《刑事-侵犯财产罪-试论司法实务认定职务侵占罪的几个问题》(第13页,发表于2022-06-24 19:19)

[6]毕业论文:《六祖慧能》FLASH动画短片设计(第34页,发表于2022-06-24 19:19)

[7]毕业论文:《依法治国的关键是依法行政》(第13页,发表于2022-06-24 19:19)

[8]毕业论文:《传统媒体与网络媒体信息传播方式的对比研究》(第14页,发表于2022-06-24 19:19)

[9]毕业论文:《企业成长与发展的动因探讨》(第17页,发表于2022-06-24 19:19)

[10]毕业论文:《企业品牌管理中存在的问题与对策》(第19页,发表于2022-06-24 19:19)

[11]毕业论文:《从小悦悦事件中浅谈媒体的社会功能》(第9页,发表于2022-06-24 19:19)

[12]毕业论文:《中小型企业仓库管理系统设计与实现》(第61页,发表于2022-06-24 19:19)

[13]毕业论文:《不动产物权预告登记及其价值研究》(第14页,发表于2022-06-24 19:19)

[14]毕业论文:《一致收敛判别方法的探讨》(第36页,发表于2022-06-24 19:19)

[15]毕业论文:《GPS无线定位系统研究与分析》(第39页,发表于2022-06-24 19:19)

[16]毕业论文:《C#中小型企业仓库管理系统设计与实现》(第62页,发表于2022-06-24 19:19)

[17]毕业论文:“陶氏”纤维织物的设计(第29页,发表于2022-06-24 19:19)

[18]毕业论文:“育鲲”轮主机废气涡轮增压器分析及其防喘振控制的设计(第22页,发表于2022-06-24 19:19)

[19]毕业论文:“欢乐时光”专杀工具的设计与实现(第33页,发表于2022-06-24 19:19)

[20]毕业论文:“推动架”零件的机械加工工艺规程及工艺装备(第25页,发表于2022-06-24 19:19)

下一篇
温馨提示

1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。

2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。

3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。

4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。

5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。

帮帮文库——12年耕耘,汇集海量精品文档,旨在将用户工作效率提升到极致