帮帮文库

返回

绘本故事:生气汤 编号18060 绘本故事:生气汤 编号18060

格式:PPT 上传:2022-06-24 19:29:09
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
绘本故事:生气汤.ppt预览图(1)
1 页 / 共 32
绘本故事:生气汤.ppt预览图(2)
2 页 / 共 32
绘本故事:生气汤.ppt预览图(3)
3 页 / 共 32
绘本故事:生气汤.ppt预览图(4)
4 页 / 共 32
绘本故事:生气汤.ppt预览图(5)
5 页 / 共 32
绘本故事:生气汤.ppt预览图(6)
6 页 / 共 32
绘本故事:生气汤.ppt预览图(7)
7 页 / 共 32
绘本故事:生气汤.ppt预览图(8)
8 页 / 共 32
绘本故事:生气汤.ppt预览图(9)
9 页 / 共 32
绘本故事:生气汤.ppt预览图(10)
10 页 / 共 32
绘本故事:生气汤.ppt预览图(11)
11 页 / 共 32
绘本故事:生气汤.ppt预览图(12)
12 页 / 共 32
绘本故事:生气汤.ppt预览图(13)
13 页 / 共 32
绘本故事:生气汤.ppt预览图(14)
14 页 / 共 32
绘本故事:生气汤.ppt预览图(15)
15 页 / 共 32

1、到的网页内容进行净化,形成了所需要的评论文本。在汽车领域的数据获取时,只提取与汽车评论相关的文本信息,将评论文本信息以的形式存放在文件夹中。本文实验数据采用从太平洋汽车网收集的包含对象名的篇评论,其中正面评论篇,负面评论篇。由于数据规模较小,本文将同公司旗下不同车系看作是同对象,如索纳塔雅绅特等现代旗下车系均认为是同对象,基于此,实验数据涉及奥迪别克本田等个对象。对于语料库中的评论文本,首先采用中国科学院的开源工具包进行中文分词处理,将评论文本用分词后的词序列进行表示。再将分词后的文本去除停用词,例如,助词连词介词等。评价指标在对文本情感分类结果进行评价时,本文采用常用的评。

2、率图模型如图所示图中的阴影圆圈表示可观测变量,非阴影圆圈表示潜在变量,箭头表示两个变量之间的条件依赖性,方框表示重复抽样,方框的右下角为重复抽样次数。由图可以看出,模型表示为三层和是语料库层的参数是文本层的变量每篇文本对应不同的和是词层的变量每个词对应个主题。通过模型中的“文档主题”分布和“主题词”分布,我们可以知道文档作者感万方数据基于概率图模型的文本对象情感分析兴趣的主题,以及每篇文档所涵盖的主题比例等。图模型模型的参数估计方法有变分贝叶斯推断,和采样等。由于采样方法描述简单且更容易实现,成为主题模型中最常采用的参数估计方法。采样本文模型参数估计采用采样方法,采样是算法。

3、样当充分大时,就可以认为是近似服从分布的个样本。数据收集预处理及评价指标文本情感分析的实现首先需要对评论文本进行分析,因此数据的收集显得十分重要。万方数据第二章预备知识与数据预处理数据收集及预处理文本信息挖掘首先需要对文本进行预处理。在网页上,除了我们所需要的有实际意义的文本信息,还有些为辅助网站组织而增加的与页面主题无关的内容,如图片视频音频以及广告栏导航条和些修饰成分等,这些并不是读者所关注的,因此可以通过源码对其进行处理,利用起分隔作用的那些标识符去除网页内容中的非文本信息和各种网页本身存在的些标记语言,仅保留下网页中的文字内容,提取出网页的正文,对所收集。

4、单对象文本的对象情感分类多对象文本的对象情感分类本章小结第四章基于模型的文本对象情感分析模型模型的生成过程模型参数估计主题词发现及文本对象情感分类主题词发现文本对象情感分类实验结果与分析每个主题被刻画为词典中所有词语上的个概率分布。模型涉及到贝叶斯理论分布多项分布概率图模型抽样等知识。假定语料库为篇文本的集合,记为文本有个词,记为每个词均是词表语料库中所有词进行去重后得到的个不同的词的集合中的项记为主题个数,则对于语料库中的每篇文档,模型定义了如下生成过程对于每篇文本,选取个主题分布对于文本中的每个词选取主题选取词,其中为词在主题下的概率分布。对应上述生成过程,模型的概。

5、链的状态,采样从均匀分布采样如果,则接受转移,即否则拒绝转移,即。对足够大的和,任函数的期望估计如下算法存在个问题链在转移过程中接受率可能偏小,万方数据基于概率图模型的文本对象情感分析这将使链收敛到平稳分布的速度过慢。当同比例放大时,公式仍然成立,即细致平稳条件仍然成立。因此,将与中的个放大到,可提高采样过程中的接受率。因此,将改造成经过上述改造,得到算法初始化链初始状态对循环以下过程进行采样时刻链的状态,采样从均匀分布采样如果,则接受转移,即否则拒绝转移,即。对足够大的和,任函数的期望估计如下采样采样算法是算法的个特例,其具体步骤如下随机初始化链初始状态对循环采。

6、价指标,即精确率召回率值进行评估。精确率和召回率分别定义如下其中,表示第类的结果中分类正确的文本个数,表示结果中第类包含的文本个数,表示第类中实际包含的文本个数。精确率衡量的是分类结果的准确程度,召回率衡量的是分类结果的查全程度。精确率和召回率有时候会出现的矛盾的情况,这样就需要综合考虑他们,值就是对精确率和召回率进行综合考虑的结果,其计算公式如下万方数据基于概率图模型的文本对象情感分析本章小结本章首先简单介绍了模型和采样等本文涉及的基础知识然后介绍了数据的收集与预处理,并对实验数据进行了分析最后对情感分类的评价指标进行了说明。为后续模型提出及文本对象情感分析提供了基础。万。

7、的个特例。算法是种简单有效的计算方法,在统计物理,统计计算,显著性检验,极大似然估计等领域有着广泛的应用。算法的基本思路是通过建立个平稳分布为的链来得到的样本,由此可以进行各种统计推断。链及其平稳分布为随机序列,随机序列所有可能取到的值组成的集合记为,称为状态空间。如果对及任意状态都有则称为链。链的性质完全由它的状态转移概率来决定,由状态到状态的步转移概率用来表示如果我们定义个矩阵,使它的第行第列的元素为,则叫做转移概率矩阵。个链可能达到个平稳分布,平稳分布就是满足下式的分布万方数据第二章预备知识与数据预处理平稳分布的条件是链是不可约非周期的,如果链是周期的,则它会在状态之。

8、赵鸿艳指导教师王素格教授学科专业模式识别与智能系统研究方向智能信息检索培养单位数学科学学院学习年限年月至年月二〇四年六月万方数据,万方数据承诺书承诺书本人郑重声明所呈交的学位论文,是在导师指导下独立完成的,学位论文的知识产权属于山西大学。如果今后以其他单位名义发表与在读期间学位论文相关的内容,将承担法律责任。除文中已经注明引用的文献资料外,本学位论文不包括任何其他个人或集体已经发表或撰写过的成果。作者签名年月日万方数据学位论文使用授权声明学位论文使用授权声明本人完全了解山西大学有关保留使用学位论文的规定,即学校有权保留并向国家有关机关或机构送交论文的复印件和电子文档,允许论。

9、间以个确定的方式循环。平稳分布的个充分条件是下面的细致平稳条件成立如果对所有上式都成立,就说马氏链是可逆的,因此式又称可逆条件,该条件蕴含着。算法假设有转移概率矩阵为的链表示从状态转移到状态的概率,对于分布,通常情况下也就是细致平稳条件不成立,所以不是这个链的平稳分布。为了使细致平稳分布条件成立,引入,则有这样就把链改造成具有平稳分布的链。在改造的过程中引入的称为接受率,物理意义可以解释为在原来的链上,从状态转移到状态时,以的概率接受转移。把上述过程进行整理,就得到了采样概率分布的算法。将上述过程进行整理,算法的具体步骤为以下三步初始化链初始状态对循环以下过程进行采样时刻。

10、,其中为词在对象主题和情感下的概率分布。对应上述生成过程,文本对象主题情感的关系如图所示,模型的概率图模型如图所示。模型参数估计语料库中所有词及其主题情感对象标签的联合概率可以分解为如下形式其中,为语料库中所有词的记号序列,为语料库中所有词的主题记号序列,为语料库中所有词的情感记号序列,为语料库中所有词的对象记号序列,假定语料库中词与词之间是相互独立的。将语料库中的词进行交换,把具有相同对象主题情感标签的词放在起,则语料库的词序列可以表示为如下形式其中,是对象标签为主题标签为情感标签为的所有词的记号序列。万方数据山西大学届硕士学位论文基于概率图模型的文本对象情感分析作者姓名。

11、文被查阅和借阅,可以采用影印缩印或扫描等手段保存汇编学位论文。同意山西大学可以用不同方式在不同媒体上发表传播论文的全部或部分内容。保密的学位论文在解密后遵守此协议。作者签名导师签名年月日万方数据目录中文摘要第章绪论研究背景目的及意义国内外研究现状本文主要研究内容论文的组织结构第二章预备知识与数据预处理模型采样链及其平稳分布算法采样数据收集预处理及评价指标数据收集及预处理评价指标本章小结第三章基于模型的文本对象情感分析模型模型的生成过程模型参数估计主题情感词发现及文本对象情感分类主题情感词发现文本对象情感分类词汇标签初始化对象标签初始化情感标签初始化主题标签初始化实验结果与分。

12、方数据第三章基于模型的文本对象情感分析第三章基于模型的文本对象情感分析本章基于概率图模型的理论,针对“对象主题情感”这文本生成过程,提出了模型。模型对文本中每个词同时采样对象和主题情感标签,最终能够得到各对象主题情感下的词序列以及文本的对象情感分布。模型模型的生成过程假定语料库为篇文本的集合,记为文本有个词,记为每个词均是词表语料库中所有词进行去重后得到的个不同的词的集合中的项记为对象个数,为情感极性的个数,为主题个数,则模型对应的文本生成过程如下为常数向量,如对于每篇文本,选取个对象分布对于文本下的对象选取对象主题情感分布对于文本中的每个词选取对象选取主题情感选取词。

参考资料:

[1]绘本故事:生气汤 编号18060(第32页,发表于2022-06-24)

[2]绘本故事:生气汤 编号18060(第32页,发表于2022-06-24)

[3]绘本故事:生气汤 编号18060(第32页,发表于2022-06-24)

[4]绘本故事:生气汤 编号18060(第32页,发表于2022-06-24)

[5]绘本故事:生气汤 编号18060(第32页,发表于2022-06-24)

[6]绘本故事:生气汤 编号18060(第32页,发表于2022-06-24)

[7]绘本故事:生气汤 编号18060(第32页,发表于2022-06-24)

[8]绘本故事:生气汤 编号18060(第32页,发表于2022-06-24)

[9]绘本故事:石头小猪 编号18060(第25页,发表于2022-06-24)

[10]绘本故事:石头小猪 编号18060(第25页,发表于2022-06-24)

[11]绘本故事:石头小猪 编号18060(第25页,发表于2022-06-24)

[12]绘本故事:石头小猪 编号18060(第25页,发表于2022-06-24)

[13]绘本故事:石头小猪 编号18060(第25页,发表于2022-06-24)

[14]绘本故事:石头小猪 编号18060(第25页,发表于2022-06-24)

[15]绘本故事:石头小猪 编号18060(第25页,发表于2022-06-24)

[16]绘本故事:石头小猪 编号18060(第25页,发表于2022-06-24)

[17]绘本故事:石头小猪 编号18060(第25页,发表于2022-06-24)

[18]绘本故事:石头小猪 编号18060(第25页,发表于2022-06-24)

[19]绘本故事:谁藏起来了 编号18060(第21页,发表于2022-06-24)

[20]绘本故事:谁藏起来了 编号18060(第21页,发表于2022-06-24)

预览结束,还剩 17 页未读
阅读全文需用电脑访问
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

1、该PPT不包含附件(如视频、讲稿),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。

2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。

3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。

4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。

5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。

绘本故事:生气汤 编号18060
帮帮文库
页面跳转中,请稍等....
帮帮文库

搜索

客服

足迹

下载文档