收录冗,需直接从检索记录中提取特征信息,以此为检索记录特征值,组成维数组将维数组插入基于哈希值特征字典之中如果存在重复数据,则表示特征字典已经存在检索记录所描述的文档,否则,没有,流程返回到,继续处理获取的检索记录,直到所有重复的数据都被处理。
实验分析为了验证基于知识图谱的图书馆电子资源自动去重方法研究的有效性,需先根据实验环境对信息进行采集,完成基本电子资源检索任务。
知识图谱构上相互统,进而形成个公用的信息系统,有利于对电子资源管理。
图书馆电子资源自动去重流程设计整个图书馆电子资源自动去重流程如图所示。
具体去重流程如下所示基于知识图谱设定,对图书馆电子资源数据库依次提交检索请求分析数据库中所检索请求相关数据,并进行格式统处理,去除非关键信息依次处理所检索的数据,直到全部数据完全处理查询每条检索记录,查看是否有数位物件识别号,以此计算知识图谱视域下对图书馆电子资源自动去重方法的探究图书馆论文多源数据库检索,其跨库检索冗余主要来自收录冗余和查全冗余两部分。
收录冗余收入冗余是指由于数据库收录时资源重叠而导致跨库检索结果冗余的,特定的刊物总是被个或多个图书馆所收录,不同数据库收录刊物存在交集,在获取信息时,通常需借助多个数据库跨库检索来实现。
知识图谱视域下对图书馆电子资源自动去重方法的探究图书馆论文。
资源整合将抓取的资源进行整合处理,使图书馆能够容纳更多信息资源。
将位于不同位置的电子信息庆华关联数据在数字图书馆移动视觉搜索系统中的应用研究数据分析与知识发现,李娜电子资源管理与评估以上海财经大学图书馆的外文电子期刊为例图书情报工作,蒲科网络时代如何提高高校图书馆电子资源的利用率科学与信息化,杨守文,王婷,张建文,等北京高科大学联盟图书馆电子资源联合采购的实践与探索情报探索,王子璇,乐小虬,何远标基于语义相似度的改进算法识别论文核心主题句研究数据分析与知,借鉴图谱去重具有极大发展潜力。
在科学技术快速发展的今天,有效节省人工查重时间的同时,将所研究的方法用到其中,使去重变得简单易行,进而提高科学查新报告水平。
参考文献闫晶,毕强,李洁,等图书馆数字资源聚合质量预测模型构建基于改进遗传算法和神经网络数据分析与知识发现,韩莹,单维峰,孙晓叶,等种在去重备份系统中数据碎片整理算法科技通报李永强提高高校图书馆电子资源利用效率的途径分析现代交际,刘图两种方法去重时间对比分析在该图书馆中去重电子资源时,所研究方法比传统方法去重时间要短去重电子资源时,所研究方法比传统方法去重时间要短去重电子资源时,所研究方法比传统方法去重时间要短。
在该图书馆中去重电子资源时,所研究方法比传统方法去重时间要短去重电子资源时,所研究方法比传统方法去重时间要短去重电子资源时,所研究方法比传统方法去重时间要短。
在该图书馆中去重电子资源时,所研存数据库之中,。
从返回的数据包中获取网页数据,随后使用解析网页,提取所需信息,并将其存入资源库之中,。
检索时间对比分析将上述收集的资源名称资源所在期刊刊物摘要作者和页码这个电子资源依次设为,将电子资源分别在个图书馆内进行检索。
分别采用传统方法与所研究方法对这个电子资源检索时间进行对比分析,结果如表所示。
表两种方法检索时间对比分析由表可知采用传统方法在电子资源为时,从书馆中检索该资源的时间最长为,而所研究方法在图书馆中检索资源所耗费的时间为。
采用传统方法在电子资源为时,从图书馆中检索该资源的时间最长为,而所研究方法在图书馆中检索资源所耗费的时间为采用所研究方法检索时间最短为,最长为。
通过该内容可知,所研究方法比传统方法最长检索时间要少,而比最短检索时间还要少。
去重时间对比分析在上述检索时间对比结果支持下,将两种方法的去重时间进行对比分析,结果如图所书情报工作,蒲科网络时代如何提高高校图书馆电子资源的利用率科学与信息化,杨守文,王婷,张建文,等北京高科大学联盟图书馆电子资源联合采购的实践与探索情报探索,王子璇,乐小虬,何远标基于语义相似度的改进算法识别论文核心主题句研究数据分析与知识发现,马佳立基于语义的数字图书馆检索模型研究电子设计工程,杨琳,刘怡麟基于大数据决策的图书馆信息系统安全分析与管理电子设计工程,刘旭高科学查新报告水平。
参考文献闫晶,毕强,李洁,等图书馆数字资源聚合质量预测模型构建基于改进遗传算法和神经网络数据分析与知识发现,韩莹,单维峰,孙晓叶,等种在去重备份系统中数据碎片整理算法科技通报李永强提高高校图书馆电子资源利用效率的途径分析现代交际,刘爽高校图书馆电子资源绩效评价指标体系构建研究情报探索,郭建宏高校图书馆电子资源专人负责制的实践探索以山西大学图书馆为例图书馆学刊,梁知识图谱视域下对图书馆电子资源自动去重方法的探究图书馆论文书馆中检索该资源的时间最长为,而所研究方法在图书馆中检索资源所耗费的时间为。
采用传统方法在电子资源为时,从图书馆中检索该资源的时间最长为,而所研究方法在图书馆中检索资源所耗费的时间为采用所研究方法检索时间最短为,最长为。
通过该内容可知,所研究方法比传统方法最长检索时间要少,而比最短检索时间还要少。
去重时间对比分析在上述检索时间对比结果支持下,将两种方法的去重时间进行对比分析,结果如图所。
基于知识图谱图书馆电子资源抓取与整合知识图谱用于分析和显示学术研究主体之间的关系,也是揭示科学知识发展进程的可视化工具。
热点关键词指的是图书馆文献中出现频率最高的关键词,能在定程度上反映出图书馆电子资源的特点。
利用软件对文献中的关键词进行统计分析,图所示热点关键词知识图谱。
图热点关键词知识图谱利用知识图谱根据给定的图书馆电子资源关键字进行自动搜索,同时将搜索结果按照预先设定的格式时间要短去重电子资源时,所研究方法比传统方法去重时间要短。
在该图书馆中去重电子资源时,所研究方法比传统方法去重时间要短去重电子资源时,所研究方法比传统方法去重时间要短去重电子资源时,所研究方法比传统方法去重时间要短。
在该图书馆中去重电子资源时,所研究方法比传统方法去重时间要短去重电子资源时,所研究方法比传统方法去重时间要短去重电子资源时,所研究方法比传统方法去重时间要短当检索关键词时,检索结果难免会出现大量冗余文献,使得用户不得不对其进行人工去重处理。
因此,研究自动去重方法是项重要课题。
采用传统自动去重方法需先确定数据库查询所返回信息中是否含有唯性信息,以这些信息作为关键特征进行检索。
由于检索结果中的每条记录都需要进行记录与对比,耗费的去重时间较长。
鉴于传统方法存在问题,利用知识图谱法,通过分析不同数据库检索信息,对图书馆电子资源进行自动去重,进而缩短去重时间晖基于知识图谱的图书馆电子资源自动去重方法研究电子设计工程,基金湖南省教育科学规划院十规划课题。
检索时间对比分析将上述收集的资源名称资源所在期刊刊物摘要作者和页码这个电子资源依次设为,将电子资源分别在个图书馆内进行检索。
分别采用传统方法与所研究方法对这个电子资源检索时间进行对比分析,结果如表所示。
表两种方法检索时间对比分析由表可知采用传统方法在电子资源为时,从基于语言值聚合算法的数据去重产品选择控制工程,王心妍,陈群英基于深度学习的图书馆个性化推荐系统的研究现代科学仪器,周运丽基于混合聚类算法的图书馆管理系统研究计算机与数字工程,刘高军,李越洋基于借阅信息的图书个性化推荐算法研究数字技术与应用,齐云飞,赵宇翔,朱庆华关联数据在数字图书馆移动视觉搜索系统中的应用研究数据分析与知识发现,李娜电子资源管理与评估以上海财经大学图书馆的外文电子期刊为例此可知,基于知识图谱的图书馆电子资源自动去重方法研究方法是具有有效性的,且去重时间较短。
结束语随着图书馆电子资源数量大幅度增加,工作人员在数据库检索过程中耗费的时间越来越长。
基于传统方法存在的问题,提出了适用于图书馆电子资源的知识图谱自动去重方法。
从知识图谱角度出发,借鉴图谱去重具有极大发展潜力。
在科学技术快速发展的今天,有效节省人工查重时间的同时,将所研究的方法用到其中,使去重变得简单易行,进而提知识图谱视域下对图书馆电子资源自动去重方法的探究图书馆论文余和查全冗余两部分。
收录冗余收入冗余是指由于数据库收录时资源重叠而导致跨库检索结果冗余的,特定的刊物总是被个或多个图书馆所收录,不同数据库收录刊物存在交集,在获取信息时,通常需借助多个数据库跨库检索来实现。
知识图谱视域下对图书馆电子资源自动去重方法的探究图书馆论文。
图两种方法去重时间对比分析在该图书馆中去重电子资源时,所研究方法比传统方法去重时间要短去重电子资源时,所研究方法比传统方法去域下对图书馆电子资源自动去重方法的探究图书馆论文。
资源整合将抓取的资源进行整合处理,使图书馆能够容纳更多信息资源。
将位于不同位置的电子信息资源存储于同位置,并对来源不同的电子资源进行集中式管理。
通过资源整合能够促进对电子资源的深入挖掘,保证用户能够通过信息检索,就能获取更多信息资源。
云计算背景下图书馆信息资源整合,包括信息检索方式协议标准和技术等方面的资源整合。
数据整合就是对分散的电子资源进行分希值,并将其作为检索特征插入特征字典之中将检索记录编号和特征值信息组成维数据插入特征字典之中图图书馆电子资源自动去重流程特征插入成功后,检索结果中是否有相同信息的索引记录,如果有,则说明索引结果中存在重复资源,丢弃该条记录,流程返回到,继续处理获取的检索记录,直到所有重复的数据都被处理。
反之,如果无重复数据,说明该
















1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。
