最基础最核心技术。个搜索引擎就是个检索系统,它掌控着人们从信息海洋中获取有用信息路径。二研究意义信息检索系统研究具有以下几方面意义解决信息超载和信息饥饿矛盾由于信息急剧增长,使得人们在获取知识时变得越来越困难。尽管像百度等搜索引擎技术能够给用户带来不少帮助,但他们所返回结果往往与用户期望结果相差甚远。对于多数用户来说,在上寻找需要信息就如同在大海中捞针样困难。因此方面呈现出来是信息超载,而另方面呈现出来是信息饥饿,其原因是当前检索着重与检索文档中存储字词,检索系统返回太多结果以至于用户无法逐个浏览,而其检索准确率很低,不能满足用户需求。尤其不能对泛概念不确定概念进行有效检索。信息检索需要不确定性推理当今自然语言处理遇到最大困难就是概念具有模糊性随机性和近似性,他们都会引起推理不确定性和演化。概念作为外部事物在主观认知中对应物成为思维活动基本单元,他不是孤立,是同外部背景有各种联系,是演变和流动过程。最近几年中多种逻辑和不确定理论被提出,最典型是基于模糊集合论虽然模糊集合论对不确定性和随机性处理有不同成都进步,但均没有取得可喜效果,源影视模糊集合论理论有许多不彻底性首先,作为模糊集合论理论基石隶属函数概念实质以及具体确定方法没有谁清楚其次,隶属函数旦通过认为假定硬化成精确数值表达后,就不再有丝毫模糊性了。针对这个问题,在传统模糊集合理论和概率统计基础上李德毅院士提出了云模型,云模型是自然语言不确定性,尤其是模糊性和随机性处理模型即定性与定量之间转换模型。适应个性化信息检索需求在张扬个性倡导创造性现代信息社会里,个性化服务更是备受人们关注和青睐。个性化信息这个概念可以从两个两个角度分析第,个性化信息是值反映人类个体特性切信息,这些信息包括了这个个体些属性描述第二,个性化信息是指由人类个体特性所决定其对信息需求种信息组合。以用户为中心信息检索,主要是研究用户行为,理解他们主要需求,根据这些需求改进和完善检索系统组织和操作,向用户主动及时准确提供所需信息。另外,数据挖掘技术为信息检索提供理论基础。为检索评价提供新方法从大量数据集中检索出信息,需要有效方法和工具,因此,检索评价研究是十分必要,新理论发展对检索评价研究提供了基础。检索性能评价可以使检索工具开发商使用最好检索策略,为用户提供更好检索工。基于语义信息检索传统信息检索方法分为两大类是基于关键词匹配地方法,这种方法首先让用户以关键词形式提出检索请求,然后将用户提交关键词与文档库中文档进行匹配,最后将那些出现了用户所提交关键词文档作为检索结果返回给用户。第二类方法称为概念信息检索,它通过对文档中信息进行语义层次上处理来析取各种概念信息,并由此形成个概念库,然后根据对用户问题理解来检索概念库中相关信息以提供检索结果。这种方法克服了基于关键词检索中不考虑语义信息局限性,并且具有较好自然语言接口。但是感念信息检索检索个不足之处就是其概念库中不包含概念之间关系描述因此无法处理有关感念关系问题。因此,使用传统搜索引擎,其检索效果远远不能令人满意。这主要表现在第是对用户问题理解不够准确,导致返回结果中有很多噪声,用户不能直接找到自己所需信息第二是对信息内容处理大多采用是基于种编码过程预处理技术或种全文分析技术,仅仅反映个问题侧面第三是用户提出问题与信息源内容不可能完全致,难以保证内容与用户问题相匹配正确率很低三信息检索原理与技术方法信息检索原理广义地讲,信息检索包含信息储存和信息检索两个过程。信息储存是对文献进行收集标引及著录,并加以有序化编排,编制信息检索工具过程信息检索是从大量信息中查找出用户所需特定信息过程。而实施检索主要方法就是利用各种检索工具见图。信息存储过程信息检索过程图信息检索原理信息储存信息储存工作内容,主要是由标引人员通过对原始文献阅读分析,对文献中信息进行鉴别提炼和浓缩,并采用特定方式予以整理保存起来。它大致有如下几个步骤选择文献。根据信息检索系统主题性质及任务等,结合原始文献本身研究水平角度及其信息质量,对原始文献进行适当评价,从中筛选出符合要求文献。文献概念分析。对所选文献进行仔细主
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
第 1 页 / 共 33 页
第 2 页 / 共 33 页
第 3 页 / 共 33 页
第 4 页 / 共 33 页
第 5 页 / 共 33 页
第 6 页 / 共 33 页
第 7 页 / 共 33 页
第 8 页 / 共 33 页
第 9 页 / 共 33 页
第 10 页 / 共 33 页
第 11 页 / 共 33 页
第 12 页 / 共 33 页
第 13 页 / 共 33 页
第 14 页 / 共 33 页
第 15 页 / 共 33 页
预览结束,还剩
18 页未读
阅读全文需用电脑访问
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。
1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。