帮帮文库

【毕业设计论文】基于clementine的数据挖掘指导的设计与开发 【毕业设计论文】基于clementine的数据挖掘指导的设计与开发

格式:DOC | 上传时间:2022-06-25 08:12 | 页数:29 页 | ✔ 可以修改 | @ 版权投诉 | ❤ 我的浏览
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
1 页 / 共 29
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
2 页 / 共 29
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
3 页 / 共 29
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
4 页 / 共 29
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
5 页 / 共 29
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
6 页 / 共 29
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
7 页 / 共 29
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
8 页 / 共 29
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
9 页 / 共 29
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
10 页 / 共 29
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
11 页 / 共 29
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
12 页 / 共 29
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
13 页 / 共 29
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
14 页 / 共 29
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
【毕业设计论文】基于clementine的数据挖掘指导的设计与开发
15 页 / 共 29

1、 决策树分类模型 基于决策树模型进行分类的基本原理概念 分类就是分析输入数据,通过在训练集中的数据表现出来的特性,为每个类找到种准 确的描述或者模型。 由此生成的类描有几个孩子 •是否有汽车 •是否有储蓄账户 •是否有活期存款 •是否有抵押 •是否有个人投资计划 四训练模型 通过下面的操作,将完成如图所示的流。 图训练模型 导入数据及预处理 插入个变项文件节点,双击该节点,在框输入 的物理路径,如图所示 图输入节点 变量。

2、 使用建立流程图,如图 所示 图总流程图 三数据集说明 数据集,以下是该数据集的所有字段名 •唯的识别号 •年龄 •性别 •地理位置 •收入 •是否已婚 •击模型查看模型结果 右键单击模型,单击查看模型结果。 图显示模型结果 结果显示模型的详细情况 将模型图标与节点相连,再添加个分析节点,执行节点显示预测值和 真实值的匹配程度如何的信息。 图添加个分析节点 图显示所建立的模型与的比较结果 五测试模型 现有。

3、 分析模型 将模型图标与节点相连,再添加个分析节点,执行节点显示预测值和 真实值的匹配程度如何的信息。 图加入分析结点 图显示模型的比较结果 聚类分析模型 聚类分析的基本原理 聚类分析就是根据相异度将数据对象分组成为多个类或簇,在 同类中的对象之间具有较高的相似度,而不同的类中的对象差别较大。 相异度是根据描述 对象的属性值来计算的。 距离是经常使用的度量方式。 注意聚类是种无指导的学习,不。

4、有对象的均值不断重复这过程直到标准测度函数开始收敛为止。 般都 采用均方差作为标准测度函数。 个聚类具有以下特点各聚类本身尽可能的紧凑, 而各聚类之间尽可能的分开。 模型建立的要求要求个以上的字段,方向为的字段 将被忽略。 建模的优点不需要分组数据,对于大型数据量分群,常是最快的分类方法。 二范例说明 该模型范例主要是根据收集的个人的系列属性把人群进行聚类分析并分为这里取 类的过程。 三数据集说明 依据的数据集是,以下是该数据集的总览及系列属性的含义的。

5、将得到的回归模型加入到节点,如图所示 图连接模型 双击结点可对其进行编辑,这里取其为默认值进入法,其他选 项也不做修改,执行该节点,如图所示 图测试模型参数选择 图源节点 变量类型的定义及实例化 在建模之前,我们首先将个类型节点加到目前的流程中,点击以 读取数据。 因为聚类分析是根据所有字段来进行聚类分析,所以把所有字段在项 设为即可,这是预处理过程。 在本类中可以看出并不对分类结果造成影响,所以设 为属性。 另外还有属性,即这个属性既作为又作为项。

6、新的数据,将建好的回归模型加入到流程中,并 利用节点分析结果。 图要建立的流 导入数据及预处理 与上面的方法相同,建立变项文件节点,选取源数据, 图添加变项文件节点,导入数据文件 预处理数据,与训练模型操作相同。 图添加节点并完成数据的预处理 查看数据源 通过个节点与源数据连接,执行结点即可。 图添加节点可查看数据源 连接模型 将得到的回归模型加入到节点。 聚类中心所代表的聚类然后再计算每个所获新聚类的聚类中心该 聚类中所。

7、类型的定义及实例化 在建模之前,我们首先将个类型节点加到目前的流程中。 点击 以读取数据。 因为需要用年龄,性别,地区,收入等等为引数来估计个人投资计划,所以将 的设为,将设为,其他字段设为。 如图所示 图节点 查看数据源 通过个节点与源数据连接,执行结点即可, 如图所示 图节点 用算法建立决策树模型 建立个结点与节点相连,如图所示 图建模过程 双击结点可对其进行编辑,这里取其为默认值进入法,其他选 项也不做修改,执行该节点,如图所示。

8、 图建模过程参数选择述用来对未来的测试数据进行分类。 数据分类是个两步过程 第步,建立个模型,描述预定的数据类集或概念集 第二步,使用模型进行分类。 中提供的回归方法有两种决策树和神经网络。 下面的例子主要基于决策树生成算法进行分类。 算法最早世纪年代的算法 是亨特提出,后经发展由在年提出了著名的 算法,主要针对离散型属性数据是后来的改进算法,它在基础上增加 了对连续属性的离散化是应用于大数据集上的分类算法,主要在执行效率和 内存使用方面进行了改进。。

9、点,执行节点显示预测值和 真实值的匹配程度如何的信息,如图所示 图模型好坏分析 五测试模型 现有新的数据,将建好的分类模型加入到流程中,并利用 节点分析结果,如图所示 图测试模型 导入数据及预处理 与上面的方法相同,建立变项文件节点,选取源数据,如图所示 图输入节点 预处理数据,与训练模型操作相同,如图所示 图测试数据筛选 查看数据源 通过个节点与源数据连接,执行结点即可, 如图所示 图查看测试数据 连接模型 。

10、。 图类型节点 基于的数据挖掘实验指导 目录 决策树分类模型 基于决策树模型进行分类的基本原理概念 二范例说明 三数据集说明 四训练模型 五测试模型 线性回归模型 回归分析的基本原理 二范例说明 三数据集说明 四训练模型 五测试模型 聚类分析模型 聚类分析的基本原理 二范例说明 三数据集说明 四建立聚类模型 关联规则模型 关联规则的基本原理 二范例说明 三数据集说明 四关联规则模型 。

11、说明 图数据集说明 •个人唯的标识符 •个人年龄 •个人性别 •个人居住地区城市城镇农村 •个人收入 •个人婚姻状况 •个人子女状况 •个人有车否 •个人是否存在存款历史 •个人是否被调查时仍有存款 •个人是否有抵押贷款 •个人购买保险状况 我们可以使用建立个聚类模型,以上述系列属性值进行 聚类,按预先设定把人群的分为类。 四建立聚类模型 导入数据及预处理 插入个变项文件节点,双击该节点,在框输入的 物理路径。 图加入模型。

12、 优点在面对数据遗漏和输入字段很多的问题时非常稳健通常 不需要很长的训练次数进行估计比些其他类型的模型易于理解,模型推出的规则有非常 直观的解释也提供强大的增强技术以提高分类的精度。 二范例说明 该范例的背景是客户详细的个人投资计划作为种市场营销活动的结果, 训练数据描述的是不同年龄,不同性别,不同地 域,不同收入,不同婚姻,等等的数据,通过分类算法对训练数据进行 建模得到决策树模型,通过得到的决策树模型来判断测试数据集里面 的每个记录的个人投资计划属性是还是。。

参考资料:

[1](终稿)【毕业设计论文】基于Android的应用软件开发实例初探(整理版).doc(最终版)(第24页,发表于2022-06-25 08:09)

[2](终稿)【毕业设计论文】基于Android的五子棋游戏设计的开发与实现(整理版).doc(最终版)(第42页,发表于2022-06-25 08:09)

[3](终稿)【毕业设计论文】基于Android的无线点餐的设计与开发(整理版).doc(最终版)(第44页,发表于2022-06-25 08:09)

[4](终稿)【毕业设计论文】基于Android的手机游戏方块派对的设计与开发(整理版).doc(最终版)(第39页,发表于2022-06-25 08:09)

[5](项目成果)10万吨生物质能燃料中心项目可行性论证申报材料(华经纵横)(第81页,发表于2022-06-25 08:09)

[6](项目成果)10万吨生物柴油高新科技项目可行性论证申报材料(华经纵横)(第68页,发表于2022-06-25 08:09)

[7](项目成果)10万吨生物柴油项目可行性论证申报材料(华经纵横)(第53页,发表于2022-06-25 08:09)

[8](终稿)【毕业设计论文】基于Android的手机流量控制软件设计的开发与实现(整理版).doc(最终版)(第40页,发表于2022-06-25 08:08)

[9](终稿)【毕业设计论文】基于android的手机公交线路查询系统设计的开发与实现(整理版).doc(最终版)(第59页,发表于2022-06-25 08:08)

[10]【毕业设计论文】基于Android的飞机大战游戏设计与开发(第62页,发表于2022-06-25 08:08)

[11]【毕业设计论文】基于Android的电子相册的设计与开发(第36页,发表于2022-06-25 08:08)

[12](终稿)【毕业设计论文】基于Android的电子相册的设计与开发(整理版).doc(最终版)(第36页,发表于2022-06-25 08:08)

[13]【毕业设计论文】基于Android的传感器游戏真心话 大冒险设计的开发与实现(第24页,发表于2022-06-25 08:08)

[14](终稿)【毕业设计论文】基于Android的传感器游戏_真心话 大冒险(毕业设计论文)(整理版).doc(最终版)(第24页,发表于2022-06-25 08:08)

[15](终稿)【毕业设计论文】基于Android的MP3播放器开发设计的开发与实现(整理版).doc(最终版)(第36页,发表于2022-06-25 08:08)

[16](终稿)【毕业设计论文】基于Android的MP3播放器的设计与开发(整理版).doc(最终版)(第36页,发表于2022-06-25 08:08)

[17](终稿)【毕业设计论文】基于AHP法的工业工程专业大学毕业生质量评价研究(整理版).doc(最终版)(第41页,发表于2022-06-25 08:08)

[18](项目成果)10万吨生物柴油产业化项目可行性论证申报材料(华经纵横)(第55页,发表于2022-06-25 08:08)

[19](项目成果)10万吨生物有机肥项目可行性论证申报材料(华经纵横)(第23页,发表于2022-06-25 08:08)

[20](项目成果)10万吨生物有机肥生产线项目可行性论证申报材料(华经纵横)(第26页,发表于2022-06-25 08:08)

下一篇
温馨提示

1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。

2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。

3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。

4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。

5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。

帮帮文库——12年耕耘,汇集海量精品文档,旨在将用户工作效率提升到极致