要点,智能化个性化特色的新型引擎成为未来搜索引擎的发展趋势。搜索引擎不仅要保存搜集起来的信息,还要将它们按照定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查遍,如此来再快的计算机系统也没有用。接受查询用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。三章介绍系统的总体结构第四章介绍系统的详细设计第五章测试与运行本系统最后是全文的总结。搜索技术的意义在此。本文的主要工作搜索引擎是根据用户的查询请求,查找信息返回给用户。为了保证用户查找信息的精度和新鲜度,搜索引擎需要建立并维护个庞大的索引数据库。般的搜索引擎由网络爬虫程序数据分析,查询数据等部分组成。本文的各章分配是这样安排的第章本文的各章分配是这样安排的第章介绍系统的开发背景第二章介绍系统的需求分析第般的搜索引擎由网络爬虫程序数据分析,查询数据等部分为了保证用户查找信息的精度和新鲜度,搜索引擎需要建立并维护个庞大的索引数据库。部分内容简介个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为你绘制幅目了然的信息地图,供你随时查阅。搜索技术的意义在此。本文的主要工作搜索引擎是根据用户的查询请求,查找信息返回给用户。为了保证用户查找信息的精度和新鲜度,搜索引擎需要建立并维护个庞大的索引数据库。般的搜索引擎由网络爬虫程序数据分析,查询数据等部分组成。本文的各章分配是这样安排的第章介绍系统的开发背景第二章介绍系统的需求分析第三章介绍系统的总体结构第四章介绍系统的详细设计第五章测试与运行本系统最后是全文的总结。音乐搜索软件的需求分析随着因特网的迅猛发展信息的增加,用户要在信息海洋里查找信息,就像大海捞针样,搜索引擎恰好解决了这难题它可以为用户提供信息检索服务。但是随着的发展,搜索引擎也面临着海量信息和人们获取所需信息能力的矛盾。个好的搜索引擎不再仅凭借数据库大小更新频率检索速度对多语言的支持这几个基本特性来衡量,如何从庞大的资料库中精确地找到正确的资料,被公认为是下代搜索技术的竞争要点,智能化个性化特色的新型引擎成为未来搜索引擎的发展趋势。搜索引擎需要实现互联网信息的快速查询,要实现以下功能。搜集信息搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛的自动搜索机器人程序来连上每个网页上的超连结。机器人程序根据网页链到其它网页中的超链接,就像日常生活中所说的传十,十传百„„样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超链接器人便可以遍历绝大部分网页。整理信息搜索引擎整理信息的过程称为建立索引。搜索引擎不仅要保存搜集起来的信息,还要将它们按照定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查遍,如此来再快的计算机系统也没有用。接受查询用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎返回主要是以网页链接的形式提供的,这些通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供小段来自这些网页的摘要信息,以帮助用户判断此网页是否含有自己需要的内容。音乐搜索软件的设计根据上章需求分析的情况,结合本软件所要需实现的功能,进行设计。本章主要介绍该软件的设计流程及步骤。系统总体流程图系统结构图是本系统结构图,该系统分两大模块数据获取模块和用户查询模块所示首先通过网络爬虫从上获取信息模拟浏览器和遍历算法保存在爬虫的缓存中进行分析如果存在音乐连接得出音乐的名字和,然后调用进行把得到的数据写入数据库,客户端过浏览器访问中间件对数据进行查询,得到用户查询结果。系统部件介绍网络爬虫网络爬虫,是个功能很强的扫描程序。它可以在扫描页面的同时检索其内的超链接并加入扫描队列等待以后扫描。因为中广泛使用超链接,所以个程序理论上可以访问整个页面。为了保证网络机器人遍历信息的广度和深度需要设定些重要的链接并制定相关的扫描策略。搜索网络机器人将遍历得到的页面存放在系统缓存中,为了提高检索效率,用正则表达式对得到的文本数据进行分析,分析出的超链接和名字并保存到数据库内方便查找而且执行效率很高。用户输入搜索条件后搜索程序将通过数据库进行检索然后把符合查询要求的数据库按照定的策略进行分级排列并且返回给用户。基于框架的端是个基于平台的框架,主要是采用和技术来实现的。由于能充分满足应用开发的需求,简单易用,敏捷迅速,在过去的年中颇受关注。把自定义标签和信息资源整合到个统的框架中。的服务器服务器是在网络中为实现信息发布资料查询数据处理等诸多应用搭建基本平台的服务器。服务器如何工作在页面处理中大致可分为三个步骤第步,浏览器向个特定的服务器发出页面请求第二步,服务器接收到页面请求后,寻找所请求的页面,并将所请求的页面传送给浏览器第三步,服务器接收到所请求的页面,并将它显示出来。是个开放源代码运行和应用软件的基于的应用软件容器。由子项目支持并由来自开放性源代码社区的志愿者进行维护。是根据和规范进行执行的,因此我们就可以说也实行了规范且比绝大多数商业应用软件服务器要好。的关系型数据库是最受欢迎,当线程中的方法被调用时,线程就进入生存周期,这时它的方法始终返回真值,直至线程进入死亡状态。线程的实现有两种方法可以实现线程,种是扩展类,另种是通过接口。所实现的代码如下,查询端框架易用性和重用性的优点,同时简化了基于的应用程序的开发。本章详细讨论架构。我们将看到是如何清晰地区分控制,事务逻辑和外观,从而简化了开发应用程序过程的。我们还将介绍提供的类如何使得开发工作更加简单,这些类包括控制程序流程的类实现和执行程序事务逻辑的类自定义的标记库使得创建和验证表单更加容易。包内容文件夹包含两个,和。在中有使用创建应用程序是所需的文件,如表所示。表系统包结构文件描述包含类。如果我们要使用提供的数据资源,就需要将这个文件拷贝到下包含中所有的类。同样也需要拷贝到下标记库描述器文件,描述了多个标记库中的自定义标记。同样要拷贝到下在下这样些下文件,如表所示。表结构应用程序描述个简单的应用程序包含站点上所有文档很多特性的示范主要用于对自定义标签库进行增加而使用的测试页,但也可以示范如何使用标记包含模板标记的介绍和范例个简单的例子,示范如何使用框架上传文件体系结构接下来从角度观察框架中的组件,其框架中三个部分模型,视窗和控制器。模型包括个组件,它有属性,代表用户输入的名字。它提供了方法,分别用于读取和设置属性,它还提供个方法,负责把属性保存到持久化存储系统中,如数据库或文件系统。对于更为复杂的应用,组件可以作为或服务的前端组件组件采用数据库连接池技术有效的利用率数据资源。视图包括个文件,它提供用户界面,接受用户输入的姓名。视图还包括个,它用来存放表单数据,并进行表单验证,如果用户没有输入姓名就提交表单,将返回出错信息。控制器包括个类,它完成三项任务进行业务逻辑调用模型组件的方法查询数据库决定将合适的视图组件返回给用户。设计细节关键字反选,如图所示。图关键字反选代码如下,高亮显示关键字替换成红色的字体分页,如图所示。图分页,分页构造上页下页以上代码是实现列举页码和顺序翻页的功能。运行测试与分析软件试运行运行采集工具从互联网采集音乐信息储存到关系数据库,如图所示。图采集工具在客户端输入查询条件进行查询查看结果,如图所示。图查询界面图查询结果音乐试听功能能够对查询到的结果进行试听,保证用户查询的准确性,如图所示。图音乐试听软件分析通过以上测试与分析表明本毕业设计达到了预期目标,实现了音乐搜索的相关功能完成对互联网的音乐信息的采集分析分类保存和查询等功能,实现
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
第 1 页 / 共 19 页
第 2 页 / 共 19 页
第 3 页 / 共 19 页
第 4 页 / 共 19 页
第 5 页 / 共 19 页
第 6 页 / 共 19 页
第 7 页 / 共 19 页
第 8 页 / 共 19 页
第 9 页 / 共 19 页
第 10 页 / 共 19 页
第 11 页 / 共 19 页
第 12 页 / 共 19 页
第 13 页 / 共 19 页
第 14 页 / 共 19 页
第 15 页 / 共 19 页
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。
1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。