1、“.....吴昊意见领袖识别中的文本倾向性研究计算机应用研究,李銳,李鹏,曲亚东,王斌,译北京人民邮电出版社,杨云,罗艳霞算法的改进计算机工程与设计,。摘要本文主要研究针对手机网络评论的意见挖掘技术。为实现手机网络评论的主题提取,本文首先构建了手机领域本体在领域本体的基础上,选取多个值作为阈值,每个阈值可构成个简单的分类器,利用集成的思想将训练得到的单个分类器组合为最终的分类器,在此过程中获得文本的主题。随后对主题与手机相关的文本进行情感分析,利用分词阶段,能够识别出汉字英文数字混合的命名实体,从而能有效提高主题提取的准确度,如本文中引入领域本体的概念,人工构造手机领域的本体概念集合,消除命名实体中的歧义性最后,应当注意评论的实效性问题抓取的文本源应在不断更新中,能紧随特定产品更新换代的频率。因此......”。
2、“.....对于改善主题提取的效果有很大帮助。参考文献姚天昉,程希文,徐飞玉,等文本意见挖掘综述中文信息学报,面向手机网络评论的意见挖掘技术研究论文原稿,胡文静基于语义理解与的文本情感分类研究天津天津师范大学,樊兴华,吴昊意见领袖识别中的文本倾向性研究计算机应用研究,李銳,李鹏,曲亚东,王斌,译北京人民邮电出版社,杨云,罗艳霞算法的改进计算机工程与设计,。本文基于上述本体般结构以及构建方法,人工构建手机领域本体的术方法,不应存在主题遗漏,对于针对不同产品或同产品不同型号间比较的文本,进行主题提取时,应注意比较特征词,从而为同类产品不同品牌间对比或相同品牌不同系列间对比做准备另外,评论文本可能存在歧义性描述。因此,应先定义相关领域的命名实体词典,以便在主题提取前的文本分词阶段,能够识别出汉字英文数字混合的命名实体,从而能有效提高主题提取的准确度,如本文中引入领域本体的概念......”。
3、“.....消除命名实体中的歧义性最后,应当注意评论的实效性问题抓取的文本源应在不断更新中,能紧随特定产品更新换代的频率。因此,处理好产品间的比较评的意见挖掘技术。为实现手机网络评论的主题提取,本文首先构建了手机领域本体在领域本体的基础上,选取多个值作为阈值,每个阈值可构成个简单的分类器,利用集成的思想将训练得到的单个分类器组合为最终的分类器,在此过程中获得文本的主题。随后对主题与手机相关的文本进行情感分析,利用频繁项集发现算法,创建个手机领域相关的情感词典,最终计算整体的好评率和差评率。关键词意见挖掘领域本体主题提取情感分析中图分类号文献标识码文章编号综述网络评论文本是消费者对相关产品的评价,包含正面或负面的情感倾向,反映出商品的外观功能性价频繁项集是指那些通常在起出现的实物集合,可解释为经常在手机领域评论文本集合中出现的词典中词语的集合......”。
4、“.....如在条记录中,有条包含手机,耐用,则手机,耐用的支持度为。在实际操作中,要找到大于预设支持度的所有项集,需列举出事物所有的组合,然后对所有组合统计它们出现的次数,当事物集合很大时,上述方法非常慢。于是学者们提出了原理,其主要思想可简化为频繁项集的子集也是频繁的,反过来也是成立的,即个项集是非频繁的,那么所有包含它的项集也是非频繁的。,则属于主题相关文本集合阈值,则属于非主题相关文本集合验证分类结果,并计算率,当时可直接退出计算根据率为当前分类器重新分配权重,率越大,分类器的权重越小,可以理解为性能越差的分类器,话语权越小更新每个样本的权重对分类正确的样本降低权重对未正确分类的样本增加其权重,以此改变数据分布依次取得数组中的元素作为阈值,计算分类率,如果当前率较小,则存储此次运算结果并重复最后......”。
5、“.....按权重叠加获得最终结果,其中,为符号函数,即或,表示属于主题相关文本集合,表示属于非主题相关文本集合为行同类累加,如例句手机耗电量少的情感得分在改进后为,为正面评价,是正确的。面向手机网络评论的意见挖掘技术研究论文原稿。结合词频和文档频率,短语星电池的待机时间重要性度量公式为本文中算法过程如下设在准备阶段爬取到的文本集合大小为,上小节中构建的本体概念集合为,计算本体概念集合中每个词条在文本集合中的值,并存储顺序读取文本集条评论文本中所有词,判断是否包含本体概念集合中的词条若包含,则计算的在文本中的词频,并计算值读取结束时计算与本文构建的手机领域本体的相关性在进行以上运算时,应当考虑个于非主题相关文本集合为最终结果。面向手机网络评论的情感分析情感分析,又称倾向性分析,它是对带有情感色彩的主观性文本进行分析处理归纳和推理的过程......”。
6、“.....意见挖掘中情感分析任务的主要目的就是识别网络评论文本的情感倾向。它有个方面的要求判斷评论文本的主客观性判断篇章句子词语的情感极性分析情感倾向性强弱。本文主要讨论情感极性的判断,提出了基于领域本体情感词典情感极性分类算法。重复步骤,直到所构建的条件树中没有元素为止。获得与手机领域本体概念集合中的名词经无关。这种方式的局限性表现在,相关性得分小于阈值的文本,也有可能是需提取的与领域相关的评论文本。可以选取多个阈值,每个阈值可构成个简单的分类器判定大于阈值的为主题相关文本,小于阈值的为非相关文本,根据分类结果的率确定每个分类器的权重,最后将训练得到的单个分类器组合为最终的分类器。以下为具体算法本文采用分类器集成算法的思想,给定已分类的文本样本集,计算每个文本的值,给定阈值的初始值为......”。
7、“.....每个样本权重的初始值为,计算过程如下步计算样本集中文本的值,按照降序排列后存储在数组中,设初始阈值对面向手机网络评论的意见挖掘技术研究论文原稿终结果。面向手机网络评论的情感分析情感分析,又称倾向性分析,它是对带有情感色彩的主观性文本进行分析处理归纳和推理的过程,如从评论文本中分析用户对手机的机身厚度像素待机时间屏幕大小价格运行速度等属性的情感倾向。意见挖掘中情感分析任务的主要目的就是识别网络评论文本的情感倾向。它有个方面的要求判斷评论文本的主客观性判断篇章句子词语的情感极性分析情感倾向性强弱。本文主要讨论情感极性的判断,提出了基于领域本体情感词典情感极性分类算法。在,相关性得分小于阈值的文本,也有可能是需提取的与领域相关的评论文本。可以选取多个阈值,每个阈值可构成个简单的分类器判定大于阈值的为主题相关文本,小于阈值的为非相关文本......”。
8、“.....最后将训练得到的单个分类器组合为最终的分类器。以下为具体算法本文采用分类器集成算法的思想,给定已分类的文本样本集,计算每个文本的值,给定阈值的初始值为,设样本集合大小为,每个样本权重的初始值为,计算过程如下步计算样本集中文本的值,按照降序排列后存储在数组中,设初始阈值对样本集中的文本进行分类阈值词典的情感极性分类算法具体过程如下对第章中获得的手机领域相关文本进行分词处理,过滤掉停用词和重复的词,剩余的词在计算机中以字典的形式存放。如表所示。结合词频和文档频率,短语星电池的待机时间重要性度量公式为本文中算法过程如下设在准备阶段爬取到的文本集合大小为,上小节中构建的本体概念集合为,计算本体概念集合中每个词条在文本集合中的值,并存储顺序读取文本集条评论文本中所有词,判断是否包含本体概念集合中的词条若包含,则计算的在文本中的词频......”。
9、“.....对于评论文本,标题位置的词语所占权重理论上应大于正文的权重,可在原有权重的基础上,对标题权重乘以,即标题权重为正文权重的倍其次,手机产品名称或手机系列名称能够作为文本的确定主题,而手机组件或产品属性,只有在产品或系列名称出现的条件下,才能够作为确定的主题,如上述例所描述。因此,手机品牌或系列名称的权重应当是其组件或属性的倍最后,公式的计算结果表明了文本与本体概念集合的相关性,但不能明确表示是否相关,般的方法是确定个阈值,当公式的结果大于或等于阈值时,判定文本与给定的领域本体相关,若小于阈值,则无关。这种方式的局限性表常起出现的评价词集合,通过与基础情感词典和评价词典比较,判断中词语的极性。实验中发现通过情感词典或评价词典对手机领域常用词进行极性分类,不能覆盖全部的词语,如耗电少在基础词典中没有出现......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。