组合来自多尺度的邻域信息,以细化样本的异常因子。等人提出了自愈神经模糊方法,并将聚类的模块,以在极低的响应时间内预测异常数据点,并避免用户恶意操作。等人针对分类器的表现随时间序列的概念漂移呈现的低效性,将基于滑窗的半监督算法使用类的聚类模型进行集成,并使用联合性和纯净度来估计模型的臵信度,最终使用阈值法决定何时分类器工作异常。随着深度学习的兴起,基于变分自编码器基于长短期记忆网络基于生成式对抗网络等深度学习方法也逐渐应用于时间序列的异常检测,但是由于这类方法需要大量有标签的训练数据以及长足的神经网络训概率论论文。同时,时序数据的时间戳和时效性同样可能存在,等人使用时序约束图对时间戳进行修复。等人挖掘近似的时序函数依赖,以实现数据时效性的检测和修复。基于机器学习的清洗基于机器学习的清洗方法是种将传统的分类聚类异常检测和深度学习等思想应用在时间序列上,以提高数据质量的方法。由于序列模型相比于向量空间模型更复杂,目前这类方法在时间序列上的应用仍处于起步状态。陈乾等人基于懒惰学习,的思想,将距离度量和具有遗忘因子的最小乘法结合,以补足距离度量探讨工业时序大数据质量管理的研究现状及方向概率论论文达式更适合进行语法修改,可以解决结构的增删问题等人提出了分布式的数据清洗系统,按照制定质量规则检测数据修复的步骤进行数据清洗。等人将已经发表的时间序列管理系统进行了全面的分析和分类,列举的均用于物联网时序数据监测时序数据分析和时序数据评估。时序大数据清洗方法时序数据质量管理和数据清洗同样重要。主流时序大数据清洗方法主要分为基于统计的清洗基于约束的清洗和基于机器学习的清洗,本节依次对这个方法进行阐述。工业时序数据质量管理不同于其他数据分析。对于复杂的工业时模糊方法,并将其应用于在线社交网络进行水平异常检测,检测的异常内容为允许未经授权的用户访问信息以及伪造信息的在线欺诈,而表现的像无声攻击的异常之是水平异常。等人提出了混合类型鲁棒检测模型,该方法是种用于混合类型数据集中异常检测的鲁棒缓冲方法,使用了集成嵌套拉普拉斯近似和变分期望最大化的期望传播。在异常检测的同时,可对数据进行清理或修复。等人提出了基于众包的方法,从而清理不确定图中的边缘,考虑到众包的时间成本,作者提出了系列边缘选择算法优化技术和修剪启发式方法,从而减少计算时间。等人采用词袋框架对时间序列进行分类,即从特征点位臵的时间序列采样局部子序列,从而构建局部描述符,并通过高斯混合模型对其分布进行建模后编码,最后使用现有分类器例如进行训练和预测等人提出了种用于时间序列分割的算法,该算法将数据流分成多个块,并按平方矩阵将其分组计算离散余弦变换,并对其量化,提取子矩阵计算其特征值模数,并删除重复项等人提出了种并行索引算法和并行查询处理策略,该策略可以拓展到数十亿个时间序列,并在给定查询的情况下有很多工业生产环境在数据系统智能化中经常遇到瓶颈问题,根据其数据形式,这些问题可归结为与时间序列有关的数据质量问题。但由于数据采集环境不同,不同系统中的针对性解决方案较多,目前学术界的方法仍不是很完备。因此,本文将对近年来数据质量管理和数据清洗的研究现状,尤其是时序大数据质量管理的研究现状进行全面分析。工业背景下的数据质量管理时序大数据的特点与静态数据不同,时间序列数据之间存在大量的依赖关系,对数据依赖关系或相关性的正确处理在时间数据处理中变得至关重要。时间序列数据在统计学上经过了数十年的研究,已经有重要的数据形式,存在大量的数据质量问题,需要设计数据清洗方法对其进行检测和有效处理。介绍了工业时序大数据的特点及工业数据质量管理的难点,并对工业时序大数据质量管理的研究现状加以分析总结,最后,提出了时序大数据质量管理方法和系统性能的提升方向。关键词工业大数据分析数据清洗数据质量管理时序数据概率论引言随着工业和中国制造等国家战略的提出,我国的大量产业面临着向智能制造转型的重大需求。而时代的到来,更是对工业物联网产生的海量大数据质量监控与分析提出了更高层次的精准性和时效性要求,。新时期的科学技术革命也来,更是对工业物联网产生的海量大数据质量监控与分析提出了更高层次的精准性和时效性要求,。新时期的科学技术革命也给我国制造业的发展带来了新的机遇。目前,我国工业生产过程中已经产生并积累了大量数据,现代化工业制造生产线传感器设备制造装臵监视器等设备能实现对整体工业生产状态和运行参数的感知和记录。而在积累的工业大数据中,时间序列数据是最基本和最普遍的数据形式。对基于采样时间点的时序数据的分析挖掘,能够促进工业大数据分析研究的发展。如果想实现可靠智能化的工业大数据分析,就需要在高质量的工业数据上进行建模计算序列,从而构建局部描述符,并通过高斯混合模型对其分布进行建模后编码,最后使用现有分类器例如进行训练和预测等人提出了种用于时间序列分割的算法,该算法将数据流分成多个块,并按平方矩阵将其分组计算离散余弦变换,并对其量化,提取子矩阵计算其特征值模数,并删除重复项等人提出了种并行索引算法和并行查询处理策略,该策略可以拓展到数十亿个时间序列,并在给定查询的情况下有效地利用索引。探讨工业时序大数据质量管理的研究现状及方向概率论论文。摘要题可归结为与时间序列有关的数据质量问题。但由于数据采集环境不同,不同系统中的针对性解决方案较多,目前学术界的方法仍不是很完备。因此,本文将对近年来数据质量管理和数据清洗的研究现状,尤其是时序大数据质量管理的研究现状进行全面分析。工业背景下的数据质量管理时序大数据的特点与静态数据不同,时间序列数据之间存在大量的依赖关系,对数据依赖关系或相关性的正确处理在时间数据处理中变得至关重要。时间序列数据在统计学上经过了数十年的研究,已经有大量的工作用于检测时间序列数据的离群值和异常值。硬件和软件技术的进步推动了探讨工业时序大数据质量管理的研究现状及方向概率论论文我国制造业的发展带来了新的机遇。目前,我国工业生产过程中已经产生并积累了大量数据,现代化工业制造生产线传感器设备制造装臵监视器等设备能实现对整体工业生产状态和运行参数的感知和记录。而在积累的工业大数据中,时间序列数据是最基本和最普遍的数据形式。对基于采样时间点的时序数据的分析挖掘,能够促进工业大数据分析研究的发展。如果想实现可靠智能化的工业大数据分析,就需要在高质量的工业数据上进行建模计算。然而,工业时序数据来源广泛,具有大体量多源性连续采样价值密度低动态性强等特点,导致目前的工业数据质量问题广泛存可以帮助人们分析问题,制定决策。然而,数据质量管理仍然是个主要问题,脏数据可能导致不可靠的分析和的决策。常见的数据质量问题包括值缺失格式不致数据重复数据异常和违反业务规则等。分析人员在做任何决策之前,必须考虑脏数据的影响,因此,数据清洗已经成为数据库研究的个关键领域。等人将异常检测方法分为两类使用约束和规则来检测和修复的定性方法使用统计方法来识别和修复的定量方法。摘要工业大数据已经成为我国制造业转型升级的重要战略资源,工业大数据分析问题正引起重视和关注。时序数据作为工业大数据中基于成本的数据修复模型,该模型是由两个部分组成的迭代过程,检测违反给定完整性约束的,并修改各组中的值,以使修改后的数据库满足完整性约束。等人提出了种新的数据清洗评价策略,除了修复的效果修复的花费之外,还考虑了数据的统计信息变化。等人提出了个基于代价的启发式修复模型,并提出了最小化修复策略,指导了后续的研究。等人提出了宽容约束,清洗数据使其符合种约束,且在给定约束的给定相似度内。等人使用正则表达式代替约束和规则进行数据清洗,因为正则表达式更适合进行。然而,工业时序数据来源广泛,具有大体量多源性连续采样价值密度低动态性强等特点,导致目前的工业数据质量问题广泛存在。点与窗口笔者在时间序列中寻找异常数据点如心电图读数中,心率突然跳跃或异常变化模式连续性心电图模式指示心律失常。后种情况通常比前种情况更具挑战性。即使在多维数据流的上下文中,单点偏差例如,新闻专线流中的第个故事也可能被视为离聚合变化点。数据类型不同种类的数据,例如连续系列如传感器离散系列如网络日志多维流如文本流网络数据如图形和社交流需要各种专用的分析方法。工业时序大数据质量管理的重要性数业大数据已经成为我国制造业转型升级的重要战略资源,工业大数据分析问题正引起重视和关注。时序数据作为工业大数据中种重要的数据形式,存在大量的数据质量问题,需要设计数据清洗方法对其进行检测和有效处理。介绍了工业时序大数据的特点及工业数据质量管理的难点,并对工业时序大数据质量管理的研究现状加以分析总结,最后,提出了时序大数据质量管理方法和系统性能的提升方向。关键词工业大数据分析数据清洗数据质量管理时序数据概率论引言随着工业和中国制造等国家战略的提出,我国的大量产业面临着向智能制造转型的重大需求。而时代的多种应用程序生成的数据集的增长,包括数据流时空数据时间网络等。传感器设备的快速发展导致各个领域对时间序列数据的计算提出大量需求。因此,数据挖掘在时间序列领域的探索也日渐增多。等人通过弹性距离测量函数将原始时间序列空间隐式映射到多内核空间,从而实现多内核聚类框架下的时间序列聚类任务等人设计了组可伸缩的算法,以时间粒度识别行为模型,即通过智能手机收集的多维时间序列来识别人类日常行为的模式等人采用词袋框架对时间序列进行分类,即从特征点位臵的时间序列采样局
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
第 1 页 / 共 9 页
第 2 页 / 共 9 页
第 3 页 / 共 9 页
第 4 页 / 共 9 页
第 5 页 / 共 9 页
第 6 页 / 共 9 页
第 7 页 / 共 9 页
第 8 页 / 共 9 页
第 9 页 / 共 9 页
预览结束,喜欢就下载吧!
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。
1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。