ppt TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读 ㊣ 精品文档 值得下载

🔯 格式:PPT | ❒ 页数:94 页 | ⭐收藏:0人 | ✔ 可以修改 | @ 版权投诉 | ❤️ 我的浏览 | 上传时间:2025-08-27 06:58

等,搜索器的功能是在中漫游,发现和搜集信息。


还要定期更新已经搜集过的旧信息,避免死链接和无效链接。


索引器即索引软件,主要是用于对网络搜索软件采集到的网页信息进行自动标引,建立可供检索的索引数据库。


检索器检索器作为用户提问与数据库的接口,负责接收用户查询请求和对该请求进行检索,对将要输出的结果进行排序,并将检索结果返回用户界面。


搜索引擎的数据检索方式主要是关键字的匹配方式,如泛匹配模糊匹配正则匹配以及多关键字的处理方式等。


并对查询结果根据种算法和规则评分和排序。


用户接口供用户输入查询,显示匹配结果。


用户接口的设计和实现使用人机交互的理论和方法,以充分适应人类的思维习惯。


搜索引擎的主要任务信息搜集各个搜索引擎都派出绰号为蜘蛛或机器人的“网页搜索软件”,在各网页中爬行,访问网络中公开区域的每个站点并记录其网址,将它们带回搜索引擎,从而创建出个详尽的网络目录。


由于网络文档的不断变化,机器人也不断地把以前已经分类组织的目录更新。


信息处理将“网页搜索软件”带回的信息进行分类整理,建立搜索引擎数据库,并定时更新数据同的页面。


例如,检索式,表示把当作个短语来搜索。


如果不加引号,搜索引擎就会把两词之间的空格按“与”处理,查出包含”,表示要求先执行括号中的运算,再执行括号外的运算。


引号引号的作用是,括在其中的多个词被当作个短语来检索。


绝大部分主要搜索引擎都支持短语检索,找到含有与短语词序和意义完全相有“计算机”“网络”和“多媒体”的页面输出时排在前面。


括号括号的作用是使括在其中的运算符优先执行,用于改变复杂检索式中固有逻辑运算符优先级的次序。


例如,检索式“多媒体计算机网络查找那些至少含有个指定关键词的页面,区别是,检索结果输出时,包含指定关键词越多的页面,其排列的位臵越靠前。


例如,检索式“计算机,网络,多媒体”,可查出包含三个关键词中的任何个或几个的页面,而同时含”的关系,查出所有同时含有“飞”和“机”两个字的页面。


这个检索结果的范围要比“飞机”作关键词的结果扩大了很多,许多结果中已不含有与“飞机”相关的信息。


逗号逗号,的作用类似于逻辑“或”,也是切记不要在构成关键词的两个字之间插入空格,否则,就会发生两个字之间进行逻辑“与”的检索错误。


例如用户要查找“飞机”这个关键词,但却输入了“飞机”,由于“飞”和“机”两字之间插入了空格,而被处理为“与的作用空格空格的作用与逻辑“与”相同。


例如检索式,表示可查出含有及的页面。


在汉字作为关键词输入时,网站。


多元搜索引擎也称为集合型搜索引擎。


它是将多个搜索引擎集成在起,通过统的检索界面进行网络信息多元搜索的检索工具。


按照工作方式的不同可分为并行处理式和串行处理式两大类。


著名的有雅虎就是以卓越的分类目录型导航服务而称誉全球,典型的分类目录搜索引擎如混合型搜索引擎它兼有检索型和目录型两种方式。


如新浪搜狐网易中华等门户天网百度悠游等。


目录型搜索引擎这类引擎将信息系统地分门归类,经过人工整理后形成庞大而有序的分类目录体系,用户可以在目录体系的导引下通过逐级浏览,发现检索到有关的信息。


只要通过搜索引擎提供的链接,就可以立刻访问到相关信息。


搜索引擎的种类检索型搜索引擎它使用自动索引软件来发现收集并标引网页,建立数据库,并以形式让用户找到所需信息资源。


比较著名的有户只要把想要查找的关键词或短语输入查询框中,并按按钮,搜索引擎就会根据输入的提问,在索引数据库中查找相应的词语,并进行必要的逻辑运算,最后给出查询的命中结果均为超文本链接形式。


用户及关键词两种信息查询途径。


分类目录查询是以资源结构为线索,将网上的信息资源按内容进行层次分类,使用户能依线性结构逐层逐类检索信息。


关键词查询是利用建立的网络资源索引数据库向网上用户提供查询“引擎”。


用词。


故有的搜索引擎数据库很大,而有的则较小。


当然,最重要的是数据库的内容必须经常更新重建,以保持与信息世界的同步发展。


信息查询每个搜索引擎都必须向用户提供个良好的信息查询界面,般包括分类目录的数量和质量上产生明显的差异。


有的搜索引擎把“网页搜索软件”发往每个站点,记录下每页的所有文本内容,并收入到数据库中从而形成全文搜索引擎而另些搜索引擎只记录网页的地址篇名特点的段落和重要的不断变化,机器人也不断地把以前已经分类组织的目录更新。


信息处理将“网页搜索软件”带回的信息进行分类整理,建立搜索引擎数据库,并定时更新数据库内容。


在进行信息分类整理阶段,不同的搜索引擎会在搜索结果派出绰号为蜘蛛或机器人的“网页搜索软件”,在各网页中爬行,访问网络中公开区域的每个站点并记录其网址,将它们带回搜索引擎,从而创建出个详尽的网络目录。


由于网络文档的不派出绰号为蜘蛛或机器人的“网页搜索软件”,在各网页中爬行,访问网络中公开区域的每个站点并记录其网址,将它们带回搜索引擎,从而创建出个详尽的网络目录。


由于网络文档的不断变化,机器人也不断地把以前已经分类组织的目录更新。


信息处理将“网页搜索软件”带回的信息进行分类整理,建立搜索引擎数据库,并定时更新数据库内容。


在进行信息分类整理阶段,不同的搜索引擎会在搜索结果的数量和质量上产生明显的差异。


有的搜索引擎把“网页搜索软件”发往每个站点,记录下每页的所有文本内容,并收入到数据库中从而形成全文搜索引擎而另些搜索引擎只记录网页的地址篇名特点的段落和重要的词。


故有的搜索引擎数据库很大,而有的则较小。


当然,最重要的是数据库的内容必须经常更新重建,以保持与信息世界的同步发展。


信息查询每个搜索引擎都必须向用户提供个良好的信息查询界面,般包括分类目录及关键词两种信息查询途径。


分类目录查询是以资源结构为线索,将网上的信息资源按内容进行层次分类,使用户能依线性结构逐层逐类检索信息。


关键词查询是利用建立的网络资源索引数据库向网上用户提供查询“引擎”。


用户只要把想要查找的关键词或短语输入查询框中,并按按钮,搜索引擎就会根据输入的提问,在索引数据库中查找相应的词语,并进行必要的逻辑运算,最后给出查询的命中结果均为超文本链接形式。


用户只要通过搜索引擎提供的链接,就可以立刻访问到相关信息。


搜索引擎的种类检索型搜索引擎它使用自动索引软件来发现收集并标引网页,建立数据库,并以形式让用户找到所需信息资源。


比较著名的有天网百度悠游等。


目录型搜索引擎这类引擎将信息系统地分门归类,经过人工整理后形成庞大而有序的分类目录体系,用户可以在目录体系的导引下通过逐级浏览,发现检索到有关的信息。


雅虎就是以卓越的分类目录型导航服务而称誉全球,典型的分类目录搜索引擎如混合型搜索引擎它兼有检索型和目录型两种方式。


如新浪搜狐网易中华等门户网站。


多元搜索引擎也称为集合型搜索引擎。


它是将多个搜索引擎集成在起,通过统的检索界面进行网络信息多元搜索的检索工具。


按照工作方式的不同可分为并行处理式和串行处理式两大类。


著名的有的作用空格空格的作用与逻辑“与”相同。


例如检索式,表示可查出含有及的页面。


在汉字作为关键词输入时,切记不要在构成关键词的两个字之间插入空格,否则,就会发生两个字之间进行逻辑“与”的检索错误。


例如用户要查找“飞机”这个关键词,但却输入了“飞机”,由于“飞”和“机”两字之间插入了空格,而被处理为“与”的关系,查出所有同时含有“飞”和“机”两个字的页面。


这个检索结果的范围要比“飞机”作关键词的结果扩大了很多,许多结果中已不含有与“飞机”相关的信息。


逗号逗号,的作用类似于逻辑“或”,也是查找那些至少含有个指定关键词的页面,区别是,检索结果输出时,包含指定关键词越多的页面,其排列的位臵越靠前。


例如,检索式“计算机,网络,多媒体”,可查出包含三个关键词中的任何个或几个的页面,而同时含有“计算机”“网络”和“多媒体”的页面输出时排在前面。


括号括号的作用是使括在其中的运算符优先执行,用于改变复杂检索式中固有逻辑运算符优先级的次序。


例如,检索式“多媒体计算机网络”,表示要求先执行括号中的运算,再执行括号外的运算。


引号引号的作用是,括在其中的多个词被当作个短语来检索。


绝大部分主要搜索引擎都支持短语检索,找到含有与短语词序和意义完全相同的页面。


例如,检索式,表示把当作个短语来搜索。


如果不加引号,搜索引擎就会把两词之间的空格按“与”处理,查出包含和的页面,结果应与用户要求的主题内容相去甚远。


截词符连接符邻近符截词符截词符般用星号表示。


当臵于个词的未尾时,表示将相同词干的词全部检索出来。


例如检索式,则表示可以检索到等词。


有些搜索引擎支持自动截词,用户不需要专门输入截词符,系统自动将相同词干的词全部找出来。


注意不能用在检索词的开始和中间。


连接符连接符有加号和减号。


在检索词前使用时,表示所有检索结果的页面中都必须包含该词。


例如检索式,表示查得的页面中应出现和方面的信息而检索式,则表示在检索结果页面中定含有,但不定有的信息。


检索词前使用时,表示任何检索结果的页面中都不能包含该词。


例如检索式,则表示查找关于的页面,但排除那些和有关的页面。


邻近符邻近符用于检索在定区域范围内同时出现的检索词的文献,它指定了检索词之间的距离。


用为精确控制检索词之间的距离,表示检索词的间距最大不超过个单词。


例如检索式,可查找出和两词之间插入不大于个单词的文献,检索结果输出时,间隔越小的排列位臵越靠前。


限定字段检索限定字段检索,即限定检索词在搜索引擎数据库中个字段范围进行查找,如网页标题站点网址链接等。


标题检索网页标题通常是对网页内容提纲挈领式的归纳。


把查询内容范围限定在网页标题中,有时能获得良好的效果。


标题检索就是在网页的标题中查找输入的检索词,使用的命令般是,其格式为检索式例如第七章信息检索工具搜索引擎搜索引擎基本理论简单地说,所谓搜索引擎,就是采用信息自动跟踪标引等技术建立在因特网上专门提供网络信息资源导航服务检索工具。


它能够通过接受用户的查询指令,并向用户提供符合其查询要求的信息资源网址。


什么是搜索引擎它是些在中主动搜索信息网页上的单词和特定的描述内容并将其自动索引的网站,其索引内容存储在可供检索的大型数据库中,建立索引和目录服务。


下一篇
TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读第1页
1 页 / 共 94
TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读第2页
2 页 / 共 94
TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读第3页
3 页 / 共 94
TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读第4页
4 页 / 共 94
TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读第5页
5 页 / 共 94
TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读第6页
6 页 / 共 94
TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读第7页
7 页 / 共 94
TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读第8页
8 页 / 共 94
TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读第9页
9 页 / 共 94
TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读第10页
10 页 / 共 94
TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读第11页
11 页 / 共 94
TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读第12页
12 页 / 共 94
TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读第13页
13 页 / 共 94
TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读第14页
14 页 / 共 94
TOP32第七章 Internet 信息检索工具—搜索引擎-精品PPT课件.ppt文档免费在线阅读第15页
15 页 / 共 94
温馨提示

1、该PPT不包含附件(如视频、讲稿),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。

2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。

3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。

4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。

5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
筛选: 精品 DOC PPT RAR
小贴士:
  • 🔯 当前文档为PPT文档,建议你点击PPT查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批