帮帮文库

doc 基于数据挖掘网页恶意代码检测技术的研究 ㊣ 精品文档 值得下载

🔯 格式:DOC | ❒ 页数:54 页 | ⭐收藏:0人 | ✔ 可以修改 | @ 版权投诉 | ❤️ 我的浏览 | 上传时间:2022-06-25 17:08

《基于数据挖掘网页恶意代码检测技术的研究》修改意见稿

1、以下这些语句存在若干问题,包括语法错误、标点使用不当、语句不通畅及信息不完整——“.....文件只包含属性特征提取结果,相对的,文件只包含属性特征提取结果。文件的部分数据内容如图所示,提取的属性特征的值包括个数值以及比例值两大类图文件中的部分数据华中科技大学硕士学位论文实验环境本实验运行于台架构的双核及内存的系统平台下,使用的数据挖掘工具为版本。包含了常用分类算法,但对算法的支持不够完善,需要手动下载库,并将其与进行整合。分类算法实验对比目前已有的分类算法较多,本实验对三类主要分类算法产生的分类结果进行了对比,这三类分类算法是朴素贝叶斯算法决策树算法以及算法。决策树算法选用了算法的实现,算法选择了库中核函数的算法。采用折交叉验证法进行结果验证,即数据被分成份,其中份用于训练,剩余的份用于测试。使用文件进行对比实验研究。图描述了三类分类算法产生的分类结果的分类率。图三类分类算法分类率由图的结果显示可知......”

2、以下这些语句存在多处问题,具体涉及到语法误用、标点符号运用不当、句子表达不流畅以及信息表述不全面——“.....即误报率上都具有比其他两类算法更好的结果,最好情况下决策树算法的值达到了左右,即漏报率为左右,该值明显高于朴素贝叶斯算法和算法的结果。然而的漏报率相对于实验目标来说还是高了点,为了进步降低漏报率,可以同时采用三种分类算法对网页进行分类,只要其中任意种算法判定该页面为恶意页面,则将该页面判定为恶意的。实验数据显示,同时采用三种分类算法可以将漏报率降到左右,相对地,产生的误报率也很高,大概为。图调整误报率和漏报率实验的曲线多种特征的分类模型对比本课题从网页中提取的属性主要包括两大类基于的属性和基于的属性,这两类属性对于恶意网页的分类有怎样的影响呢下面将针对这两类属性分别进行实验,比较两种类型的属性对恶意网页进行分类的效果,同时会将结果跟使用全部属性进行分类的结果对比......”

3、以下这些语句在语言表达上出现了多方面的问题,包括语法错误、标点符号使用不规范、句子结构不够流畅,以及内容阐述不够详尽和全面——“.....并不在求解最优化问题和计算决策函数时显式计算非线性函数,而是只计算核函数。核函数的选择必须满足条件,优化问题的数学形式为,,,,华中科技大学硕士学位论文,,,其中,是核函数,分类判别函数为本研究收集的数据集中既包含数值数据,也包含有分类数据,但支持向量机算法只能处理数值型数据,因此,需要对数据集中的分类数据进行转换。数据集中只有表示网页是否为恶意性这样的个分类数据,将该属性值由转换为,讲属性值由转换为。数据集中的其他属性特征值都为数值,但是有的属性值是统计地个数值,而有的属性值是统计的比例值,这样就导致各属性值的范围不同......”

4、以下这些语句该文档存在较明显的语言表达瑕疵,包括语法错误、标点符号使用不规范,句子结构不够顺畅,以及信息传达不充分,需要综合性的修订与完善——“.....因而不会使样本因类型不全而出现倾斜的情况。正常脚本文件通过从收集到的正常页面中提取脚本对应的链接下载获得。图描述了数据样本的分布,其中正常页面个,正常脚本文件个,恶意页面个,恶意脚本文件个。第二华中科技大学硕士学位论文章根据攻击过程的不同阶段对恶意网页进行了特征分类总结,图描述了恶意样本中各类型样本的数据。由于有些恶意页面不只包含类特征,因而图中的数据累加之和大于总得恶意样本数,且有些特征无法通过人工进行区分,因而图中的数据只是个大概的统计。由图的数据可以看出,恶意网页中大量使用了混淆技术。表恶意样本列表网址收集日期华中科技大学硕士学位论文图数据样本组成图恶意样本组成成分收集到足量样本文件之后,需要通过第三章介绍的特征提取方法,对样本数据进行属性特征提取,生成适合于使用的文件。由于研究的需要,总共生成了三个文件和......”

5、以下这些语句存在多种问题,包括语法错误、不规范的标点符号使用、句子结构不够清晰流畅,以及信息传达不够完整详尽——“.....可以通过调整分类算法的参数在误报率和漏报率之间进行调整,然而较低的误报率会导致较高的漏报率,反之亦然。本课题的目标是使分类模型的漏报率尽可能的低,能够尽量多的将恶意网页检测出来。这将不可避免地导致较高的误报率,但没有关系,后续可以通过动态检测方法来降低误报率。图给出了三类分类算法通过调整参数来协调误报率和漏报率实验的曲线,受试者工作特征曲线,描述灵敏度与特异度关系的曲线。由图可以看出决策树算法在简称,将恶意网页正确地判定为恶意网页的比例,减去该值即为漏报率和更加的完美。华中科技大学硕士学位论文参考文献赛门铁克互联网安全威胁报告第期,年月,,,,,,,,,,,,,,,,,,,,,,华中科技大学硕士学位论文,,fi,,,,,,,,,,许骏,柳泉波文件解析器设计原理算法和应用小型微型计算机系统,,,引擎简称......”

6、以下这些语句存在多方面的问题亟需改进,具体而言:标点符号运用不当,句子结构条理性不足导致流畅度欠佳,存在语法误用情况,且在内容表述上缺乏完整性。——“.....仅为,朴素贝叶斯算法和算法的分类率相对高很多,分别为和。朴素贝叶斯算法对属性间的属性作了独立性假设,而该假设在恶意网页提取的属性间不成立,因为恶意代码使用的各种技术表现出来的特征都不是个单的属性,而是多个属性的结合,这就导致了朴素贝叶斯算法分类结果的正确性比较低。算法的性能取决于组好的参数,包括惩罚因子不敏感参数核函数的参数等,华中科技大学硕士学位论文算法的参数调整和模型选择是支持向量机研究领域个还没有完全解决的难题,可以通过不断测试调整这些参数,使得算法产生更好的分类结果。决策树算法具有速度快,准确率高的特点,且其生成的分类结果可解释性强,图展示了通过产生的决策树分类结果的图形化显示结果,该决策树的叶子节点数为,节点总数为......”

7、以下这些语句存在标点错误、句法不清、语法失误和内容缺失等问题,需改进——“.....恶意网页包括恶意页面和恶意脚本文件,因此,需要同时收集页面和脚本文件两类数据。恶意数据样本主要有两个数据来源通过些知名的恶意网址发布站点收集样本,如。本实验收集了从年月到年月之间的恶意数据样本。由于恶意网页的生成周期较短,且同类型恶意网页在段时间内扩散范围较广,为了使数据样本中各类恶意样本的比例较均衡,因此,未将所有的恶意样本进行收集,而是每类恶意网页收集定量的样本。通过此途径收集到的数据较少,大概占总比例的。结合爬虫与提供的收集样本。通过爬虫大范围爬取网页,提取,依据查询该是否为恶意,若为恶意,则人工进行网页数据收集。表列出了部分收集到的恶意样本的网址以及收集的日期,由于网页恶意代码的生成周期较短,目前大部分样本已无法访问。正常样本中的页面通过下载公布的全球访问前名的网站的首页获得......”

8、以下文段存在较多缺陷,具体而言:语法误用情况较多,标点符号使用不规范,影响文本断句理解;句子结构与表达缺乏流畅性,阅读体验受影响——“.....针对这个问题,将数据集中的所有属性的范围都归化到到的范围,先确定每个特征值的最大最小值,然后将数据归化,使得最小值为,最大值为,其他值介于到之间。研究过程中使用的算法采用的开源库中的算法。算法的性能取决于组好的参数,对分类效果影响较大的几个参数包括核函数类型核函数中的值核函数中的值惩罚因子是否使用启发式等。为了达到较好的分类效果,采用数据集对的参数进行了调整选择实验,取得较好分类效果的参数设置如表所示表算法的参数设置参数名核函数类型核函数中的值核函数中的值惩罚因子是否使用启发式参数值函数是华中科技大学硕士学位论文数据挖掘分类模型研究本节主要对分类算法产生的分类模型进行研究对比,从多个不同的方面进行实验,并会给出比较详细的研究分析。数据准备进行数据挖掘实验之前需要准备数据集,包括两方面的数据恶意网页和正常网页......”

9、以下这些语句存在多方面瑕疵,具体表现在:语法结构错误频现,标点符号运用失当,句子表达欠流畅,以及信息阐述不够周全,影响了整体的可读性和准确性——“.....由图可以看出,基于的属性比基于的属性有更好的分类效果。为了躲避常规恶意网页检测工具的查杀,恶意页面越来越像正常华中科技大学硕士学位论文页面,明显的恶意特征越来越少,且攻击者不断尝试利用新的标签进行恶意代码嵌入,并将更多的恶意代码通过代码实现,即使恶意代码大量使用混淆技术,隐藏了些明显的恶意特征,但混淆技术的引用也带来些其他的特征,如执行函数的调用等,通过对这些函数进行检测还是能够较准确地区分恶意网页和正常网页的。图多种特征的分类结果对比由实验数据还可以看出,单独使用基于的属性或基于的属性进行分类的效果都没有将两种属性进行结合的效果好。由此说明,网页恶意代码攻击需要页面和代码的协调合作,此外,代码是嵌入在页面中,恶意脚本文件的引入,必然会使页面产生些不正常的特征......”

下一篇
基于数据挖掘网页恶意代码检测技术的研究
基于数据挖掘网页恶意代码检测技术的研究
1 页 / 共 54
基于数据挖掘网页恶意代码检测技术的研究
基于数据挖掘网页恶意代码检测技术的研究
2 页 / 共 54
基于数据挖掘网页恶意代码检测技术的研究
基于数据挖掘网页恶意代码检测技术的研究
3 页 / 共 54
基于数据挖掘网页恶意代码检测技术的研究
基于数据挖掘网页恶意代码检测技术的研究
4 页 / 共 54
基于数据挖掘网页恶意代码检测技术的研究
基于数据挖掘网页恶意代码检测技术的研究
5 页 / 共 54
基于数据挖掘网页恶意代码检测技术的研究
基于数据挖掘网页恶意代码检测技术的研究
6 页 / 共 54
基于数据挖掘网页恶意代码检测技术的研究
基于数据挖掘网页恶意代码检测技术的研究
7 页 / 共 54
基于数据挖掘网页恶意代码检测技术的研究
基于数据挖掘网页恶意代码检测技术的研究
8 页 / 共 54
基于数据挖掘网页恶意代码检测技术的研究
基于数据挖掘网页恶意代码检测技术的研究
9 页 / 共 54
基于数据挖掘网页恶意代码检测技术的研究
基于数据挖掘网页恶意代码检测技术的研究
10 页 / 共 54
基于数据挖掘网页恶意代码检测技术的研究
基于数据挖掘网页恶意代码检测技术的研究
11 页 / 共 54
基于数据挖掘网页恶意代码检测技术的研究
基于数据挖掘网页恶意代码检测技术的研究
12 页 / 共 54
基于数据挖掘网页恶意代码检测技术的研究
基于数据挖掘网页恶意代码检测技术的研究
13 页 / 共 54
基于数据挖掘网页恶意代码检测技术的研究
基于数据挖掘网页恶意代码检测技术的研究
14 页 / 共 54
基于数据挖掘网页恶意代码检测技术的研究
基于数据挖掘网页恶意代码检测技术的研究
15 页 / 共 54
温馨提示

1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。

2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。

3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。

4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。

5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。

  • 文档助手,定制查找
    精品 全部 DOC PPT RAR
换一批