批量样本数为,样本总迭代轮次设臵为,训练过程采用字向量,并拼接成整个文本向量在编码阶段,将文本向量输入到模型中进步提取文本向量特征在标注序列预测阶段,根据文本向量特征为每个分词预测标签,得到可能的标注预测如下预测标签位于每个词后标注预测结合导弹技术单位上报,拟申请通用拖车辆。标注预测结合导弹技术单位上报,拟申请通用拖车辆。标注预测结合导弹技术单位上报,拟申请通用设备军事保障设施军事装备类易混淆命名实体识别的效果,使军事命名实体识别效果达到通用领域水平。参考文献朱佳晖基于双向和的军事命名实体识别和链接第届中国指挥控制大会论文集上册中国指挥与控制学会,北京李健龙,王盼卿,韩琪羽基于双向的军事命名实体识别计算机工程与科学,王学锋,杨若鹏,朱巍基于深度学习的军事命名实体识别方法装甲兵工程学院学报,杨国荣形而上学与哲学的内在视域学术月刊蓝天,王文双,程继红基于本体的军事保障元数据构建方法研究计算机与现代化融合本体特征下的军事实体识别模型研究军事通讯论文请通用拖车辆。融合本体特征下的军事实体识别模型研究军事通讯论文。为了进步说明本体特征对军事命名实体识别的影响,分别统计组实验下的军事人员军事保障机构军事保障设备军事保障设施军事装备类命名实体的值,结果如图所示曲线。根据图可以直观得出,与实验实验相比,实验中加入本体特征,使得类军事命名实体的值均有所提升。尤其是军事保障设备军事保障设施军事装备类易混淆命名实体识别的值提高幅度最为明显,分别达到,相比实验分别提高了,相比实层数目设臵为,隐藏层神经元数目分别设臵为。词向量维度设臵为维,模型单次输入序列长度设臵为。神经网络模型训练采用小批量随机梯度下降算法,批量样本数为,样本总迭代轮次设臵为,训练过程采用优化器,设臵为,学习率设臵为。实验与结果分析实验过程设计整个实验过程包括文本向量化编码标注序列预测军事实体提取个阶段。以文本结合导弹技术单位上报,拟申请通用拖车辆为例。在文本向量化阶段,使用分词工具进行原始文本分词,并根据军事本体词向量字典字典学信息,以缓解分词不准确以及未登录词对命名实体识别的影响。本文同样使用工具,以单字为粒度进行字向量训练,生成字向量字典。根据字向量字典,确定第个分词的字向量组成为。根据概率目标函数,得到正确概率最大的标注序列为第组。在军事实体提取阶段,根据标注序列提取其中的军事实体,其中导弹技术单位为军事保障机构实体,通用拖车为军事保障设备实体。本实验使用的军事文本语料来源于军事装备全生命周期运转过程中产生的真实文本,通过机器标注与人工校验结本体特征向量根据领域本体,可以方便地推理出个词语所蕴含的深层语义关系。通过分析军事装备领域本体,得到指导命名实体识别的语义关系包括子类关系,体现普遍性与特殊性的关系属性关系,体现本体的对象与对应属性的关系实例关系,体现抽象与具体的关系。将上述种语义关系作为军事词语的本体特征表示,具体军事本体特征类别如表所示。表军事本体特征类别根据表中的军事本体特征类别,使用表示不同的本体特征标注。定义本体特征标注集为,定义单位矩阵∈,其中单位实体识别提供领域知识指导参考军语军械勤务军事主题词简明词典等专业词典,查阅大量军事装备相关报告与学术论文,汇总整理得到军事保障设备个术语军事保障设施个术语军事保障机构个术语军事人员个术语军事装备及主要组成部件个术语总计个术语定义等价属种相关非交种关系将众多军事概念联系起来对军事领域概念的属性进行定义,参考可靠性维修性保障性术语对概念的数据属性信息进行描述,构建军事装备领域概念的属性集合选择概念,通过查询军事保障数据库,为所建本体添加概念实例本体模型校验量,然后将每个输出向量送入个多层感知器,网络中,并通过函数进行归化处理,得到此分词被标注为各类军事命名实体标签的概率值,从而完成标注预测过程。其中,第个分词标预测标注为标签的概率表示为式中∶,表示输入为∶的双向长短期记忆网络的第个输出表示向量归化处理后的第维表示。使用上述方法对每个分词进行标签预测,得到向量,表示的第维度,表示第个分词被标注为,为所建本体添加概念实例本体模型校验,利用推理机进行逻辑检测,对本体概念进行致性和包含性检测,对实例进行冲突检测,以发现本体中概念定义矛盾实例属性关系关联有误的情况,确保本体库逻辑上的正确性军事领域本体模型文档化,利用的文档生成工具进行规范化文档的生成工作。融合本体特征的文本向量表示神经网络模型只能接受数值向量作为输入,。因此,本节将本体特征分词字者分别处理为相应的向量,共同构成文本向量表示。融合本体特征下的可以有效提高军事实体识别的准确率。本节通过构建军事领域本体,将军事领域知识进行体系化组织,方便领域知识的检索与获取,并进步将本体特征融入到文本向量中,构建融合本体特征的文本向量表示。军事领域本体军事领域本体以军事保障本体为上层本体参考,遵循步法本体建模方法,使用本体开发工具进行构建,构建流程如图所示。图军事领域本体构建流程框图军事领域本体构建流程具体如下明确军事领域本体涉及军事装备以及部分军事装备保障方面的概念。构建军事领域本体目的是建融合本体特征下的军事实体识别模型研究军事通讯论文利用推理机进行逻辑检测,对本体概念进行致性和包含性检测,对实例进行冲突检测,以发现本体中概念定义矛盾实例属性关系关联有误的情况,确保本体库逻辑上的正确性军事领域本体模型文档化,利用的文档生成工具进行规范化文档的生成工作。融合本体特征的文本向量表示神经网络模型只能接受数值向量作为输入,。因此,本节将本体特征分词字者分别处理为相应的向量,共同构成文本向量表示。融合本体特征下的军事实体识别模型研究军事通讯论文过构建军事领域本体,将军事领域知识进行体系化组织,方便领域知识的检索与获取,并进步将本体特征融入到文本向量中,构建融合本体特征的文本向量表示。军事领域本体军事领域本体以军事保障本体为上层本体参考,遵循步法本体建模方法,使用本体开发工具进行构建,构建流程如图所示。图军事领域本体构建流程框图军事领域本体构建流程具体如下明确军事领域本体涉及军事装备以及部分军事装备保障方面的概念。构建军事领域本体目的是建立具有逻辑检测与可扩展的本体库,为军事命特征标注集为,定义单位矩阵∈,其中单位矩阵的每个行向量表示个本体特征标注。则第个词语的本体特征向量表示为。词向量和字向量使用结巴分词库对输入文本进行分词处理,并采用工具生成词向量字典。假设输入文本为,分词处理得到个词语,根据词向量字典将可以得到每个分词的向量化表示,从而拼接成整个输入文本的向量,记做。考虑到军事文本中专有名词数量较多,分词准确率较低,且由于词向量字典不够完备,未登录词现象普遍,对命名实体识别签的概率,即。同时,本文引入标签对因子,对相邻标签之间的兼容性进行评分,将标签之间的影响反映到序列评分中。定义评分矩阵∈表示相邻标签之间的兼容性得分,其中表示标签类别数目,在本模型中。军事本体的构建与应用本体源于拉丁文,意思是事物的本质。在计算机学科中,被广泛应用在知识表示信息系统领域分析人工智能等领域。根据军事领域本体提取文本相应的本体特征,并将其融合到命名实体识别方面,可以有效提高军事实体识别的准确率。本节军事实体识别模型研究军事通讯论文。为了更有效地利用上下文信息,识别文本序列间的顺序关系,本文采用进行军事命名实体识别工作,分别从正向从第个词到最后个词和反向从最后个词到第个词对输入向量进行编码操作,最后将两部分输出向量进行拼接处理。标注预测模块命名实体识别通常被建模为序列标注任务,通过对文本进行标签标注从而进行对应命名实体的提取。本文使用标注模型进行文本序列标注。模型输入向量∶,经过编码模块进行编码处理后得到输出具有逻辑检测与可扩展的本体库,为军事命名实体识别提供领域知识指导参考军语军械勤务军事主题词简明词典等专业词典,查阅大量军事装备相关报告与学术论文,汇总整理得到军事保障设备个术语军事保障设施个术语军事保障机构个术语军事人员个术语军事装备及主要组成部件个术语总计个术语定义等价属种相关非交种关系将众多军事概念联系起来对军事领域概念的属性进行定义,参考可靠性维修性保障性术语对概念的数据属性信息进行描述,构建军事装备领域概念的属性集合选择概念,通过查询军事保障数据会造成影响。本文加入字向量以提供词语的内部形态学信息,以缓解分词不准确以及未登录词对命名实体识别的影响。本文同样使用工具,以单字为粒度进行字向量训练,生成字向量字典。根据字向量字典,确定第个分词的字向量组成为。军事本体的构建与应用本体源于拉丁文,意思是事物的本质。在计算机学科中,被广泛应用在知识表示信息系统领域分析人工智能等领域。根据军事领域本体提取文本相应的本体特征,并将其融合到命名实体识别方面融合本体特征下的军事实体识别模型研究军事通讯论文优化器,设臵为,学习率设臵为。本体特征向量根据领域本体,可以方便地推理出个词语所蕴含的深层语义关系。通过分析军事装备领域本体,得到指导命名实体识别的语义关系包括子类关系,体现普遍性与特殊性的关系属性关系,体现本体的对象与对应属性的关系实例关系,体现抽象与具体的关系。将上述种语义关系作为军事词语的本体特征表示,具体军事本体特征类别如表所示。表军事本体特征类别根据表中的军事本体特征类别,使用表示不同的本体特征标注。定义本车辆。根据概率目标函数,得到正确概率最大的标注序列为第组。在军事实体提取阶段,根据标注
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
第 1 页 / 共 10 页
第 2 页 / 共 10 页
第 3 页 / 共 10 页
第 4 页 / 共 10 页
第 5 页 / 共 10 页
第 6 页 / 共 10 页
第 7 页 / 共 10 页
第 8 页 / 共 10 页
第 9 页 / 共 10 页
第 10 页 / 共 10 页
预览结束,喜欢就下载吧!
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。
1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。