滤。经过三层过滤后,得到总的分值,系统根据设定的下限阈值和上限阈值本文设定来对邮件类别进行判断。基于信头特征的过滤根据垃圾邮件的定量描述,设垃圾邮件的信头特征为,将它包含的元素分别设为,根据不同的设定的权值如表所示。表垃圾邮件的信头特征的具体内容权值字段个数大于等于个对邮件发送服务器做反查询,发送服务器的域名与不匹配发件人地址在黑名单中查询黑名单表发件人地址在白名单中查询白名单表邮件的发件人和收件人地址相同邮件发送服务器的域名与邮件发件人的域名不同分钟内同个发件人发送的邮件个数超过可接受值对于封邮件,根据表,查询对应的权值,计算这层的分值,并累计入总的分值中。对于信头特征项,采用黑白名单过滤技术。黑白名单过滤技术的特点是简单高效,系统资源消耗小,易于实施。但是,黑白名单过滤并不适合所有用户,来自黑名单中地址的邮件,对于些用户来说可能是正常邮件。如些发送广告邮件的服务器,被列入了黑名单,如果采用黑名单过滤,则对需要广告邮件的用户,就意味着正常邮件的丢失。基于规则的过滤目前基于内容的过滤技术主要有基于规则过滤和基于统计过滤两种。基于统计过滤的优点是规则通过机器学习自动产生,规则更新较及时,但是在规则生成过程中,需要大量的邮件样本作为过滤器的训练集。本文设计的过滤系统是基于客户端的,如果采用基于统计过滤技术,存在两个问题客户端用户可能无法得到大量的的训练集,使得过滤系统训练不充分,影响过滤效果。客户端用户使用的训练集可能不适合其需求,造成过滤效果不理想。基于规则的过滤可以直接使用现有的规则集,无需利用邮件样本进行训练,就可达到较为满意的过滤效果,适合客户端用户,因此,本文采用基于规则的过滤技术。基于规则过滤效果与规则集密切相关,而些成熟的规则过滤器的规则集,大多针对英文邮件,在处理中文邮件时,突出的问题是存在些规则的分值有些偏高,中文用户使用前需要对规则分值进行较大的调整。敏感关键字过滤基于内容邮件过滤器进行攻击的方法主要有种切词破坏单词沙拉欺骗和隐藏攻击稀疏数据攻击干扰过滤器再学习。切词破坏是指垃圾邮件发送者经常采用些方法来掩盖敏感关键字,发动针对内容过滤器的攻击,如把文本中规范的敏感关键字替换为经过变换后的词。这种经过伪装的邮件,方面读者通常能够理解经过变换后的词,另方面,还可以逃脱基于内容的邮件过滤系统的拦截。本文针对切词破坏,使用第三层过滤,定义敏感关键字表,将免费色情等敏感关键字存储到敏感关键字表中,然后使用种改进的中文关键字匹配算法进行第三层过滤。五系统分析可行性分析可行性研究是以相对短的时间和相对低的成本来确定给定的问题是否有解。这里相对短和相对低是指和实现建议系统所需时间和成本相比较而言。可行性研究主要从下述个方面进行研究技术可行性经济可行性操作可行性和调度可行性。技术可行性技术可行性的考虑集中在现存的计算机。参考文献作者美核心编程第二版人民邮电出版社年月日作者美网络编程基础电子工业出版社年月日出版作者成洁,卢紫毅窗口程序设计精彩实力分析清华大学出版社年月日出版作者刘宴兵李春。使用实现邮件发送设计计算机工程与应用年第卷第期作者陈勇李卓桓反垃圾邮件完全手册清华大学出版社年月作者加英电子工业出版社年月电子邮件网,网址中国协议分析网,网址开发文档手册配法的原理较简单,易于在计算机上实现,时间复杂度比较低。逆向最大匹配法通常简称为法。法的基本原理与法相同,不同的是分词的扫描方向,它是从右至左取子串进行匹配。最少切分分词法其基本思想是使每句中切出的词的数量最少。基于词频的统计方法统计方法般不依赖于词典,而是将原文中任意前后紧邻的两个字作为个词进行出现频率的统计,出现的次数越高,成为个词的可能性也就越大。在频率超过个预先设定得阈值时,就将其作为个词进行分词处理。这种方法能够有效地提取出词典中不存在的词,可以作为基于词典分词方法的有效补充。据统计,在英语中大约有个最常用的词语被放入了停用词表,高频的功能词占到了文本词语的。中文停用词与英文停用词有定差别,因为中文的功能词在语言结构中可能有多重角色,多重含义。然而,去除停用词也是必要的。特征项的提取特征项选取的任务就是要将信息量小不重要的词汇从特征项空间中删除,从而减少特征项的个数。特征提取的好坏直接关系到分类结果的优劣。构成文本的特征项越多,分类算法的代价就越高,过多的特征项还会导致无法准确地提取文档的类别信息,造成分类效果不佳。因此,需要在不牺牲分类质量的前提下,尽可能的降低特征项的个数。特征项选取是文本自动分类系统中的个关键步骤。关于特征选取,有五种常用的特征提取的方法文档频率,信息增益,互信息,开方拟合检验,术语强度,等。二过滤模式客户端过滤模式基于客户端的过滤模式不必担心过滤会形成邮件服务器的瓶颈,可以真正对邮件进行内容过滤,从而提高邮件过滤的精确度。客户端模式可以帮助过滤系统实时地接受用户的反馈,体现特定用户的个性化需求,提高邮件过滤的精确度,本文采用基于客户端的过滤模式。本文在对垃圾邮件进行定量描述的基础上,研究多层过滤,对黑白名单过滤和种中文关键字匹配算法进行了改进,并研究了用户反馈机制,设计了种基于客户端的邮件过滤系统,该系统能接收用户反馈信息,体现用户的个性化需求,可以较好解决邮件判定标准问题。多层过滤各种过滤技术有各自的优点,如果能综合使用多种过滤技术,将提高邮件过滤系统的性能。本文研究的系统运行在客户端,不必担心过滤系统会造成服务器的处理瓶颈,因此本文采用多层过滤策略,对电子邮件的进行完全地过滤检测。第层为基于信头特征过滤,根据信头特征进行过滤。第二层过滤采用基于规则过滤,依据权值和过滤算法对邮件的分值进行计算。第三层过滤则是对敏感关键字,使用种中文匹配算法进行过硬件能否支持被研究的系统,首先关心的是该组织是否有相应的软件和硬件能够支持处理建议的应用程序。其次考虑在规定平台之上,利用现有的成熟技术是否能够实现这个应用。现代计算机硬软件技术的飞速发展,为系统建设提供了技术条件。计算机等基础设施的更新换代也紧跟潮流的发展,这就为开发系统提供了的形成,用函数来实现,详细的文件格式有结构体给出。在碰撞检测,以及物体三维显示中,场景中各物体的绘制均是采用读取模型文件来建立的。首先读取个文件,在该文件中设置了场景的对象树目各对象的名称和对象的初始位置。实验中各参数值如图所示场景中对象划分个数场景的对象名称场景对象初始坐标场景对象初始坐标场景对象初始坐标图实验中数据读取文件中参数值的实现代码如下,读出对象的数量读出对象的名称和对象的初始位置然后根据读取的每个对象名称,可以获得该对象所在的文件名,通过这些文件名读取外部文件可以继续将各个对象的各种参数读出来。如顶点数目面的数目摩擦系数纹理参数等。本程序中采用面模型来实现三维物体的建模,考虑到物体建模的复杂度,采用了最常用的多面体建模,具体的来说,输入模型是组无拓扑约束的三角面片。其中对物体三维空间的划分,是靠自己来定义的,包括了物体用多少三角面片来表达,每个三角面片的顶点在空间的坐标等等,这些信息都存在文件中。三维物体的建模是通过调用库函数在三维空间中绘制三角形面片来实现。物体分的越细,三角面片就越小,真实感就越强。缺点就是,增加了碰撞检测算法的复杂度,不利于实时性的监测,同时生成三维实体所耗费的时间增加。为了能够逼真的看到物体的建模过程,在程序中用两种方法来实现,种是线框模式绘制种是颜色实体绘制。在线框模式下如图中可以清楚地看到若干个点绘制三角形片的框架。图线框模式绘制在虚拟场景中地板是静止规则简单的物体,因此对于地板的建模我们只需要调用库函数即可。场景中地板的绘制代码如下绘制地板,,,,,,,,,,,,,,,,,,,,,,,场景绘制为了虚拟场景到达更加逼真的效果,需要对虚拟场景进行各种处理,比如,添加光照纹理等。可以根据光照条件创造出和真实世界非常接近的图形来,有三种类型的光照环境光散射光和镜面光。环境光不来自任何特殊方向,它有光源,但是被周围的房间或场景多次反射后以至于变得没有方向。被环境光照射的物体表面各个方向都均等受光。散射光来自个方向,被物体表面均匀地反射。即使光是被均匀反射回去的,它直射的物体表面比从个角度照射过来时要亮。比较典型的散射光源是荧光照明设备或中午时入射侧窗的太阳光束。镜面光和散射光样有方向性,但被强烈地反射到另特定的方向。高亮度的镜面光往往能在被照射的物体表面上产生称之为亮斑的亮点。本实例中光源定义代码如下光源定义,,,,,,在绘制多面体圆柱体易拉罐和立方体箱子时,使用函数即法线矢量定义了物体表面在空间的方向,尤其是滤。经过三层过滤后,得到总的分值,系统根据设定的下限阈值和上限阈值本文设定来对邮件类别进行判断。基于信头特征的过滤根据垃圾邮件的定量描述,设垃圾邮件的信头特征为,将它包含的元素分别设为,根据不同的设定的权值如表所示。表垃圾邮件的信头特征的具体内容权值字段个数大于等于个对邮件发送服务器做反查询,发送服务器的域名与不匹配发件人地址在黑名单中查询黑名单表发件人地址在白名单中查询白名单表邮件的发件人和收件人地址相同邮件发送服务器的域名与邮件发件人的域名不同分钟内同个发件人发送的邮件个数超过可接受值对于封邮件,根据表,查询对应的权值,计算这层的分值,并累计入总的分值中。对于信头特征项,采用黑白名单过滤技术。黑白名单过滤技术的特点是简单高效,系统资源消耗小,易于实施。但是,黑白名单过滤并不适合所有用户,来自黑名单中地址的邮件,对于些用户来说可能是正常邮件。如些发送广告邮件的服务器,被列入了黑名单,如果采用黑名单过滤,则对需要广告邮件的用户,就意味着正常邮件的丢失。基于规则的过滤目前基于内容的过滤技术主要有基于规则过滤和基于统计过滤两种。基于统计过滤的优点是规则通过机器学习自动产生,规则更新较及时,但是在规则生成过程中,需要大量的邮件样本作为过滤器的训练集。本文设计的过滤系统是基于客户端的,如果采用基于统计过滤技术,存在两个问题客户端用户可能无法得到大量的的训练集,使得过滤系统训练不充分,影响过滤效果。客户端用户使用的训练集可能不适合其需求,造成过滤效果不理想。基于规则的过滤可以直接使用现有的规则集,无需利用邮件样本进行训练,就可达到较为满意的过滤效果,适合客户端用户,因此,本文采用基于规则的过滤技术。基于规则过滤效果与规则集密切相关,而些成熟的规则过滤器的规则集,大多针对英文邮件,在处理中文邮件时,突出的问题是存在些规则的分值有些偏高,中文用户使用前需要对规则分值进行较大的调整。敏感关键字过滤基于内容邮件过滤器进行攻击的方法主要有种切词破坏单词沙拉欺骗和隐藏攻击稀疏数据攻击干扰过滤器再学习。切词破坏是指垃圾邮件发送者经常采用些方法来掩盖敏感关键字,发动针对内容过滤器的攻击,如把文本中规范的敏感关键字替换为经过变换后的词。这种经过伪装的邮件,方面读者通常能够理解经过变换后的词,另方面,还可以逃脱基于内容的邮件过滤系统的拦截。本文针对切词破坏,使用第三层过滤,定义敏感关键字表,将免费色情等敏感关键字存储到敏感关键字表中,然后使用种改进的中文关键字匹配算法进行第三层过滤。五系统分析可行性分析可行性研究是以相对短的时间和相对低的成本来确定给定的问题是否有解。这里相对短和相对低是指和实现建议系统所需时间和成本相比较而言。可行性研究主要从下述个方面进行研究技术可行性经济可行性操作可行性和调度可行性。技术可行性技术可行性的考虑集中在现存的计算机