帮帮文库

返回

专家检索研究综述 专家检索研究综述

格式:word 上传:2022-06-25 07:31:06

《专家检索研究综述》修改意见稿

1、“..... , , , , , 此外,在这两次的专家检索任务中,给参与者提供了包含个候选专家的列表, 在候选专家列表中包括了专家的全名和邮件地址。 语料库 和的数据集,是 于年月从的公开网站上抓取的。该数据集共,包括了 个文档,含个超链接,其中的网页至少包含个外链接,且这些外链接包含 锚文本。等指出,中大约的文档是网页,的文档是 和格式的,剩下的文档则是多媒体和等格式的。没有给参与者提 供候选专家列表,而只是提供了员工邮件地址的个模板 如,所以参与者需在数据集中识别出专 家的基于图的专家检索方法 该方法基于这样的假设,即个体之间所发送的信息能够指示他在特定领域的专长。其主 要思想是在图,其中表示图中的结点,表示图中的边中候选专家作为 节点,专家之间的联系作为边,而这种联系可能是种问答关系或者是合作关系。可利用社 会网络分析专家之间的联系......”

2、“..... 基于图的专家检索方法是基于文档的专家检索的个子系列。在基于候选专家之间 专家检索研究综述 摘要增加了企业检索任务并设立了专家检索子任务, 为专家检索方法和技术的经验性评价提供了平台,并着重从专家检索算法模型和评价方法 等几方面进行了探讨,极大地促进了专家检索研究的发展。本文即是在此背景下,对近年来 专家检索研究的进展和现状进行的系统总结。本文分别从专家检索的数据集来源专家检索 方法专家检索的排序方法专家检索的效果评价这四个方面对专家检索的相关研究进行了 介绍和评述。 关键词专家专家专长专家档案专家证据专家检索 , , 列表,并从这些专家列表中为每个查询主题查找相关专家。自设立专家检 索子任务后,为专家检索的方法和技术进行经验性评价提供了个公共平台,近几年 来,分别对专家检索算法模型和评价进行了探讨,促进了专家检索领域的发展......”

3、“.....等界定为以下两个方面查找具有专长的专家 和查找专家所具有的专长。目前,检索界所探讨的专家检索般是指前个方面。本文所探 讨的专家检索也是指查找具有专长的专家,故本文中的专家检索主要任务可以描述为利 用企业或者组织内外能够表征专家专长的各种文档和资源,如电子邮件报告数据库文 件和网页等,识别专家在给定查询主题领域的专长相关性程度,并按程度高低排序显 示专家结果列表的过程。 本文组织如下第二节介绍用于专家检索的数据集来源,第三节介绍专家检索的方法, 第四节介绍专家检索排序,第五节介绍专家检索结果的评价,最后第六节对本文工作进行简 要总结。 专家检索的数据集来源 般来说,要实现专家检索需要两个必要条件即专家列表和包含专家专长信息的数据 集。其中......”

4、“..... 这些信息都是用户手动添加进去的,其存在以下缺陷首先,该数据库需要受手动创建和维 护,因此费时费力其次,专家的专长信息是不断更新的,而数据却不易更新,故数据 库的信息往往是陈旧的再者,利用这些数据库进行专家检索时对查询格式有固定的格式化 要求,缺乏灵活性。 企业内部网 从企业的内部公开网站上获得的企业内部网页企业内部邮件企业内部文档简历 个人主页等可以作为专家专长信息的来源。如为专家检索子任务提供了两 种数据集,, 引言 进入世纪,人类社会正在由信息社会迈向知识社会,掌握定知识经验和技能的 人才将会成为企业和组织最宝贵的资源。各领域的专家是该领域知识的代表,所拥有的丰富 且最新的该领域的专业知识技能和经验是企业生存和发展的最关键因素。目前,些企业 和组织,为了提高自身的竞争优势,已经或者正在建立专家检索系统......”

5、“..... 专家检索亦称之为专家查询,专家推荐,专长定位,专长识别作为实体检索的 个特例,它要求返回的实体类型是具有特定专长与查询主题相关的的专家。由于专家检 索在促进知识共享和交流,构建学术界和产业界的桥梁,知识管理等方面有重要的应用价值, 近年来专家检索引起了学术界广泛兴趣。 作为的后继项目,于年增加了企业 检索任务,并设立了专家检索子任务。该子任务可以描述为给定文档集, 查询主题集和专家而利用伪相关集 来扩展最初的查询并为查询主题词重新设置权值。 和通过给相关性很大的文档中的主题词加权来选择扩展词,由于候 选专家的档案和支持文档中包括了候选专家其它的与查询主题不相关的专家领域,如果将这 个文档作为查询扩展,则其它不相关的专长领域会影响到查询扩展的效果,从而使得最后扩 展的查询主题失去了原有意思即跑题。在文中提出......”

6、“.....可以有效避免查询扩展中的跑题。等将检 索结果相关性排名前的文档中的出现频次前的检索主题词作为查询扩展词。 跑题是将查询扩展运用到专家检索不可避免的现象,目前有些衡量专家 档案中跑题发生的次数的方法,但还未提出些衡量跑题是何时与如何发 生的方法。总之,查询扩展的在专家检索中的成功运用有助于发现相似专家,也有助于在组 织中自动创建专长路线图......”

7、“.....个专家出现在与查询主题相关的文档中,则该专家可能是与 查询主题相关的专家,且出现的文档与查询主题的相关性越大,则是专家的可能性也就越大。 基于文档的专家检索方法就是将候选专家与查询主题之间查找这些文档中的新的专家,即当文档把相关性传递给候选专家后 后,相关性传递不会终止,还会通过该专家推荐的文档将相关性传递给其它候选专家。基于 此,等提出了在大的企业或者内部网络中建立由候选专家,组织文档和它们 之间相互联系构成的专长图,通过该图来研究候选专家与文档之间的联系。采用该方法 能识别出文档中没有直接提到的但与查询主题相关的专家。 基于窗口的专家检索方法 目前,些学者们为了减少与候选专家不是很相关的文档的相关性传递,尝试采用基于 窗口的专家检索方法......”

8、“..... 年以前,已有些学者将该方法有效地运用到文档检索中。等提出,进 行文档检索时,不返回整个文档,而返回只与查询相关文档的部分内容等则通 过名字等特征信息周围大小固定的窗口来对人进行描述,并进步查找实体之间的联系 等研究候选专家与查询主题词之间的共现模型时,通过对比基于文档的共现和基于窗 口的共现子模型,得出后个子模型优于前个子模型,这为后面参与者采用基于窗口的专 家检索方法提供了依据。 基于窗口的专家检索主要有两种方法种方法,只考虑固定大小的窗口中的文本内容, 如等在参加会议时,采用窗口来建立候选专家的描述。其基本思想是 利用专家姓名或者邮件地址附近的信息创建专家的档案在年,和 等通过设置不同大小的窗口扩展了该模型。另种方法,考虑在与候选专家相关的文档 中,查询词和候选专家的相关性与文档中该查询词和表示专家姓名与邮件地址的词之间的词 距离存在依存性......”

9、“..... 的关系转化为查询主题与文档之 间的关系。目前,研究者认为基于文档权重归并的专家检索方法比基于专家档案的检索方法 更有效,主要是因为用于估算与候选专家相关度的文本内容比专家档案中的文本内容的 歧义要少,因此信息的模糊性也较低。 图是基于文档的专家检索流程图,从图可知,该方法首先利用般信息检索模型如 向量空间模型概率模型语言模型等检索出与查询相关的文档,然后根据文档与查询的 相关性给文档赋定的权值,最后通过归并专家的相关文档权值来计算该专家的专长得分, 并根据该得分为专家排序。 基于文档的专家检索在研究候选专家与查询主题之间的相关性时,主要通过文档来传递 这种相关性。目前主要是通过以下两种方式来实现这种相关性传递 步相关性传递 步相关性传递是基于这样的假设即当用户查询到与主题相关的文档时,则用户就会 停止其查询行为......”

下一篇
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
专家检索研究综述.doc预览图(1)
1 页 / 共 25
专家检索研究综述.doc预览图(2)
2 页 / 共 25
专家检索研究综述.doc预览图(3)
3 页 / 共 25
专家检索研究综述.doc预览图(4)
4 页 / 共 25
专家检索研究综述.doc预览图(5)
5 页 / 共 25
专家检索研究综述.doc预览图(6)
6 页 / 共 25
专家检索研究综述.doc预览图(7)
7 页 / 共 25
专家检索研究综述.doc预览图(8)
8 页 / 共 25
专家检索研究综述.doc预览图(9)
9 页 / 共 25
专家检索研究综述.doc预览图(10)
10 页 / 共 25
专家检索研究综述.doc预览图(11)
11 页 / 共 25
专家检索研究综述.doc预览图(12)
12 页 / 共 25
专家检索研究综述.doc预览图(13)
13 页 / 共 25
专家检索研究综述.doc预览图(14)
14 页 / 共 25
专家检索研究综述.doc预览图(15)
15 页 / 共 25
预览结束,还剩 10 页未读
阅读全文需用电脑访问
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
DOC PPT RAR 精品 全部
小贴士:
  • 🔯 当前文档为word文档,建议你点击DOC查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批

搜索

客服

足迹

下载文档