帮帮文库

返回

基于Lucene的电力客户搜索引擎设计(原稿) 基于Lucene的电力客户搜索引擎设计(原稿)

格式:word 上传:2022-06-26 21:13:03

《基于Lucene的电力客户搜索引擎设计(原稿)》修改意见稿

1、“.....全量方式处理的数据别的地址信息制定了相应的处理策略。对于前两种情况,系统根据地址信息的特点,对包含省市区县乡镇村的地址,增加相应的简称,如内容江宁区江宁县处理结果江宁对于同音词的处理,通过分析小区信息,增加了地址同音词词库,使得系统能够识别相应的同存在较大问题,造成用电客户信息不能及时查询到,从而影响了业务办理的效率。过滤器姓名处理由于电力客户姓名中存在相似音,为了能够定位到这部分客户,需要对电力客户姓名实现相似音搜索,系统对分词器识别的电力客户姓名,增加了姓名拼音识别处理,将务电费电价管理计量管理客户用电安全管理等多项电力工作的工作效率。本文通过研究技术,搭建基于实现的用电客户搜索引擎系统,提高供电公司业务工作效率。关键词电力客户搜索引擎引言目前电力公司已经建立了基于的电力客户搜索引擎设计原稿将输入数据以种称为倒排索引的数据结构进行存储。在进行关键字快速查找时......”

2、“.....方案概述系统架构系统由数据采集数据索引数据检索数据交互部分组成,如下图所示图系统架构图数据采集通过全量分地址信息的识别,系统对分词器识别的地址信息制定了相应的处理策略。对于前两种情况,系统根据地址信息的特点,对包含省市区县乡镇村的地址,增加相应的简称,如内容江宁区江宁县处理结果江宁对于同音词的处理,通过分析小区信息,增加了地址同音实现。全量数据采集系统搭建完成后,首次运行需要对所有用电客户信息进行采集,这就需要采用全量方式进行采集,全量方式处理的数据量大,所需时间长,因此只适用于在首次或算法进行重大调整时,需要对所有数据进行重新索引时使用。倒排索引供电单位联系电话身份证信息等内容,可查看用户其他详细信息。基于的电力客户搜索引擎设计原稿。过滤器姓名处理由于电力客户姓名中存在相似音,为了能够定位到这部分客户,需要对电力客户姓名实现相似音搜索......”

3、“.....系统进步根据姓名汉字和拼音音调的综合匹配程度进行评分和排序。如搜索张时检索结果过滤系统根据登录用户的单位及地域信息对搜索结果进行过滤,如属于江宁营业部的用户进行用户搜索张时,则将与江宁营业部匹配的用户客户进行展示姓名,增加了姓名拼音识别处理,将识别后的结果作为分词数据添加到索引中。如内容张处理结果地址处理由于存在多种原因地址名称更改如县改为区等录入时使用简称或全称由于同音词存在使得录入不致。为了实现对这部数据采集数据采集模块负责获取传统数据库中的客户信息,并对客户信息进行组织处理。主要通过全量采集和增量采集两种方式实现。全量数据采集系统搭建完成后,首次运行需要对所有用电客户信息进行采集,这就需要采用全量方式进行采集,全量方式处理的数据统架构图数据采集通过全量和增量两种方式从结构化数据库中获取原始数据......”

4、“.....将客户信息中的字符串进行分词及其他处理,并将返回的所有字符串进行倒排处理后查询条件预处理组织查询条件对查询结果进行过滤和排序数据交互包括搜索界面结果展示与数据接口,搜索界面与结果展示是系统和用户交互的界面。数据接口为其他系统微信等系统提供接口,通过调用接口实现电力客户信息搜索。基于的电力词词库,使得系统能够识别相应的同音词。如内容花园处理结果花园花苑数据检索检索条件预处理为体现易用性,在对搜索条件识别时,对搜索条件进行预处理。摘要电力客户信息是供电企业开展电力工作的基础,如何快速准确定位用电客户,将直接影响到营业业姓名,增加了姓名拼音识别处理,将识别后的结果作为分词数据添加到索引中。如内容张处理结果地址处理由于存在多种原因地址名称更改如县改为区等录入时使用简称或全称由于同音词存在使得录入不致。为了实现对这部将输入数据以种称为倒排索引的数据结构进行存储......”

5、“.....这种数据结构能够有效的利用磁盘空间。方案概述系统架构系统由数据采集数据索引数据检索数据交互部分组成,如下图所示图系统架构图数据采集通过全量根据关键字对搜索的结果进行展示,提供用电客户姓名客户编号客户地址供电单位联系电话身份证信息等内容,可查看用户其他详细信息。数据采集数据采集模块负责获取传统数据库中的客户信息,并对客户信息进行组织处理。主要通过全量采集和增量采集两种方式基于的电力客户搜索引擎设计原稿添加到索引库数据检索负责查询条件预处理组织查询条件对查询结果进行过滤和排序数据交互包括搜索界面结果展示与数据接口,搜索界面与结果展示是系统和用户交互的界面。数据接口为其他系统微信等系统提供接口,通过调用接口实现电力客户信息搜将输入数据以种称为倒排索引的数据结构进行存储。在进行关键字快速查找时,这种数据结构能够有效的利用磁盘空间......”

6、“.....如下图所示图系统架构图数据采集通过全量作。倒排索引将输入数据以种称为倒排索引的数据结构进行存储。在进行关键字快速查找时,这种数据结构能够有效的利用磁盘空间。方案概述系统架构系统由数据采集数据索引数据检索数据交互部分组成,如下图所示图系宁局江宁供电局,关键字将均被识别为江宁营业部检索结果排序在内部排序的基础上,系统进步根据姓名汉字和拼音音调的综合匹配程度进行评分和排序。如搜索张时检索结果过滤系统根据登录用户的单位及地域信息对搜索结果进行过滤,如属于江宁营客户搜索引擎设计原稿。创建文档将原始文档转换为文本过程在数据采集过程已经进行处理,并将处理数据保存供数据索引时使用。分析文档在索引操作时,通过中文分词技术和过滤器结合来分析文本,将文本数据分割成语汇单元串,然后对它们执行些可选择操姓名,增加了姓名拼音识别处理,将识别后的结果作为分词数据添加到索引中......”

7、“.....为了实现对这部和增量两种方式从结构化数据库中获取原始数据,并对客户数据进行组织处理为接收的数据格式数据索引索引程序通过中文分词及过滤器,将客户信息中的字符串进行分词及其他处理,并将返回的所有字符串进行倒排处理后添加到索引库数据检索负实现。全量数据采集系统搭建完成后,首次运行需要对所有用电客户信息进行采集,这就需要采用全量方式进行采集,全量方式处理的数据量大,所需时间长,因此只适用于在首次或算法进行重大调整时,需要对所有数据进行重新索引时使用。倒排索引据量大,所需时间长,因此只适用于在首次或算法进行重大调整时,需要对所有数据进行重新索引时使用。系统能够支持定的容错性。例如针对供电单位江宁营业部江宁江宁区江宁供电公司江宁局江宁供电局,关键字将均被识别为江宁营业部检索结果排序在部的用户进行用户搜索张时......”

8、“.....而其它区域的电力客户将不展示。如此大大缩小了电力客户搜索结果数量,同时也更符合用户意愿。结果展示类似于百度等搜索引擎界面。在搜索栏中输入关键字即可进行搜索。基于的电力客户搜索引擎设计原稿将输入数据以种称为倒排索引的数据结构进行存储。在进行关键字快速查找时,这种数据结构能够有效的利用磁盘空间。方案概述系统架构系统由数据采集数据索引数据检索数据交互部分组成,如下图所示图系统架构图数据采集通过全量音词。如内容花园处理结果花园花苑数据检索检索条件预处理为体现易用性,在对搜索条件识别时,对搜索条件进行预处理。基于的电力客户搜索引擎设计原稿。系统能够支持定的容错性。例如针对供电单位江宁营业部江宁江宁区江宁供电公司江实现。全量数据采集系统搭建完成后,首次运行需要对所有用电客户信息进行采集,这就需要采用全量方式进行采集,全量方式处理的数据量大,所需时间长......”

9、“.....需要对所有数据进行重新索引时使用。倒排索引识别后的结果作为分词数据添加到索引中。如内容张处理结果地址处理由于存在多种原因地址名称更改如县改为区等录入时使用简称或全称由于同音词存在使得录入不致。为了实现对这部分地址信息的识别,系统对分词器识营销系统用采系统等多套系统来为用户提供相应的电力服务工作,但是这部分系统都是基于传统的数据库建立,业务处理时都需要准确的用户信息才能得到查询结果,而实际上由于多种原因使得系统内部有大量电力客户信息存在不完整或不准确的情况,使得数据质量词词库,使得系统能够识别相应的同音词。如内容花园处理结果花园花苑数据检索检索条件预处理为体现易用性,在对搜索条件识别时,对搜索条件进行预处理。摘要电力客户信息是供电企业开展电力工作的基础,如何快速准确定位用电客户,将直接影响到营业业姓名,增加了姓名拼音识别处理,将识别后的结果作为分词数据添加到索引中......”

下一篇
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
基于Lucene的电力客户搜索引擎设计(原稿).doc预览图(1)
1 页 / 共 7
基于Lucene的电力客户搜索引擎设计(原稿).doc预览图(2)
2 页 / 共 7
基于Lucene的电力客户搜索引擎设计(原稿).doc预览图(3)
3 页 / 共 7
基于Lucene的电力客户搜索引擎设计(原稿).doc预览图(4)
4 页 / 共 7
基于Lucene的电力客户搜索引擎设计(原稿).doc预览图(5)
5 页 / 共 7
基于Lucene的电力客户搜索引擎设计(原稿).doc预览图(6)
6 页 / 共 7
基于Lucene的电力客户搜索引擎设计(原稿).doc预览图(7)
7 页 / 共 7
预览结束,喜欢就下载吧!
  • 内容预览结束,喜欢就下载吧!
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
DOC PPT RAR 精品 全部
小贴士:
  • 🔯 当前文档为word文档,建议你点击DOC查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批

搜索

客服

足迹

下载文档