帮帮文库

返回

软件度量模型(最终版) 软件度量模型(最终版)

格式:word 上传:2025-08-10 22:08:00
,由此可见,出现最多的分化合并和方案是样的。经过检验,已不能合并,所以结果就是第五节多重填补方法前面的方法中采用的方法可称为单填补。考虑到单填补受随机性的影响较大。下面考虑基于种蒙特卡洛模拟的多重填补方法。如果是来自于连续型度量的个缺失值,比如,在个最接近项目的已知值的基础上,通过使用非参数核的方法产生了个连续的分布,可假设缺失值来自如下的概率密度函数对应的分布,其中,是核函数,是带宽,此处取。如果是来自于离散型度量的个缺失值,比如,在个最接近项目的已知值的基础上,假定缺失值来自如下的离散分布通过从分布中独立地抽样,蒙特卡洛模拟可以被用来产生个完全数据样本。用这种方法重复次,得出组完全数据集。再进行逐步回归。这样往复次得出个逐步回归的结果,出现次数如下最常见的回归结果是这种组合出现了次,为出现最多的组合。即化简为。第六节总结第种法是用个最接近的完整的观测值的加权平均值补充的唯的组完整数据,再虚拟变量并回归分析。第二种模特卡落模拟法是利用个最接近的完整的观测值模拟缺失数据的分布,模拟出组完整数据,进行次回归分析。我们结合次的结果方法方法看似差别不小。实际只是是否入选有所不同。方法中入选并和合并为类。方法中没有入选。我们猜测是因为由于对的影响不符合线性分布,可见的,只是代表种不同的开发平台的种类。进行变量选择后这种非线形的情况得到定程度的缓解。不过种结果比较接近,都是可以接受的。结论本论文通过对构建软件度量模型的研究和证表明在建立个预测模型时,基于直觉或者经验假定所作的预测度量变量选择,可能含有冗余的或者不必要的预测度量,并可导致在数据选择上的资源浪费。另外,缺失数据也经常出现在用来构造软件度量模型的数据样本中。为了克服这个问题,本论文采用了单填补方法和基于计算机模拟方法的多重填补,并就如何优化简化初始模型做了介绍。使用来自数据库版本中的数据,我们做了个应用实例研究,证明该方法的有效性。对于离散型变量用填补可能出现小数的情况,我们用改进的和蒙特卡洛模拟的方法来填补。在得到完整的数据后,我们先对离散变量虚拟变量化,然后再用逐步回归法进行模型简化。这种方法虽然可以对变量类别进行定程度的合并,但没有对所有的分化合并的情况进行全面考虑。如果数据仍有交互效应,非线性分布的情况,本文所论证的方法的准确性可能会受到较大的影响。另外,在方法中的选取核密度估计中带宽的选取都需要进步考虑。致谢这里我首先要感谢我的导师。谢老师平日里工作繁多,但在我做毕业设计的每个阶段,从查阅资料和设计草案的确定到理论讲解再到论文修改等整个过程中都给予了我细心的指导。谢老师耐心地纠正我设计中的。他的治学严谨和科学研究的精神是我永远学习的榜样,并将积极影响我今后的学习和工作。参考文献何晓群和刘文卿,应用回归分析,北京中国人民大学出版社,年月第二版陈嘉贤,种推导广义软件度量模型的方法,广州暨南大学出版社张文彤和董伟,统计分析高级教程,高等教育出版社,年月第版,,种基于非完整数据样本来简化软件度量模型的统计方法,国际软件工程与知识工程杂志年第卷第期附录内容名称附录宏删除缺失个数大于个的组附录缺失数据填补的程序附录,第列的空缺数据应为,附录虚拟变量的语句虚拟变量的语句附录删除缺失个数大于个的组附录缺失数据填补的程序,计算行数显示数据,计算最大最小值,确定该行是否有数据不全,,计算欧式距离输出距离第,行与第行计算填补的数据,的加权值,这个加权值是通过距离反比加权算法得出的。例如,如果为缺失值,则填补值应为当所有的缺失值都被填补之后,数据样本即为完整的,可按完整的数据样本进行任何分析。第三章离散型变量的处理方法在回归分析中,我们对些自变量是离散型变量的情形先给予数量化处理,但简单的数量化常常存在些问题。种更好的处理方法是引进适当个数的只取和的虚拟自变量。当属性出现时,虚拟变量取值,否则取值为。下面就这方法作介绍。第节简单情况首先讨论离散变量只取两类可能值的情况,例如研究粮食产量问题,为粮食产量,为施肥量,另外再考虑气候问题,分为正常年份和干旱年份两种情况,对这个问题的数量化方法是引入个型变量,令,表示正常年份,表示干旱年份粮食产量的回归模型为ε其中在以下回归模型中不再注明。干旱年份的粮食平均产量为正常年份的粮食平均产量为这里有个前提条件,就是认为干旱年份与正常年份回归直线的斜率是相等的,也就是说,不论是干旱年份还是正常年份,施肥量每增加个单位,粮食产量平均都增加相同的数量。对式的参数估计仍采用普通最小二乘法。第二节复杂情况些场合离散自变量可能取多类值,例如商厦策划营销方案,需要考虑销售额的季节性影响,季节因素分为春夏秋冬种情况。为了用定性自变量反映春夏秋冬四季,我们初步设想引入如下个型自变量,春季,夏季,其他,其他,秋季,冬季,其他,其他可是这样做产生了个新的问题,即个自变量,之和恒等于,即,构成完全多重共线性,解决这个问题的方法很简单,我们只需去掉个型自变量即可,例如去掉,只保留。对般情况,个离散变量有类可能的取值时,需要引入个型自变量,当时,只需要引入个型自变量即可。对于包含多个型自变量的计算,仍然是采用普通的线性最小二乘回归方法,在此就不举例了。第四章经典变量选择的方法在多元线性回归分析中,并不是所有自变量都对因变量有显著的影响,这就存在着如何挑选出对因变量有显著影响的自变量问题。自变量的所有可能子集构成个回归方程。当可供选择的自变量不太多时,可以对切可能的回归方程用个准则去挑出最优的方程但是当自变量的个数较多时,要求出所有可能的回归方程是非常困难的。为此要用些较为简便实用快速的选择最优方程的方法。不同的方法各有优缺点,至今还没有绝对最优的方法,目前常用的方法有前进法后退法逐步回归法,而逐步回归法应用最广。第节前进法前进法的思想是变量由少到多,每次增加个直至没有可引入的变量为止。具体做法是首先将全部个自变量,分别对因变量建立个元线性回归方程,并分别计算这个元回归方程的个回归系数的检验值,记为,选其最大者记为,给定显著性水平。若则首先将,引入回归方程,为了方便,设就是。接下来因变量分别与,建立个二元线性回归方程对这个回归方程中,的回归系数进行检验,计算值记为,选其最大的记为若则接着将,引入回归方程。依上述方法接着做下去。直至所有未被引入方程的自变量的值均小于,时为止。这时,得到的回归方程就是最终确定的方程。每步检验中的临界值,与自变量数目有关,在用软件计算时,我们实际使用的是显著性值或记为作检验。第二节后退法后退法与前进法相反,首先用全部个变量建立个回归方程,然后在这个变量中选择个最不重要的变量,将它从方程中剔除。在回归系数的显著性检验中,用的就是这种思想,把回归系数检验的值最小者对应的自变量剔除。设对个回归系数进行检验,记求得的值为,选其最小者记为给定显著性水平,若则首先将从回归方程中剔除,为方便,设就是。接着对剩下的个自变量重新建立回归方程,进行回归系数的显著性检验,像上面那样计算出,如果又有则剔除,重新建立关于个自变量的回归方程。依此下去,直至回归方程中所剩余的个自变量的检验值均大于临界值,没有可剔除的自变量为止。这时,得到的回归方程就是最终确定的方程。前进法和后退法显然都有明显的不足。前进法可能存在这样的问题,即不能反映引进新的自变量后的变化情况。因为个自变量开始可能是显著的,但当引入其他自变量后它变得并不显著了,但是再没有机会将其剔除。即旦引入,就是终身制的这种只考虑引入,而没有考虑剔除的做法显然是不全面的。而且,我们在许多例子中会发现可能最先引入的个自变量,当其他自变量相继引入后,它会变得对因变量很不显著。后退法的明显不足是,开始把全部自变量引入回归方程,这样计算量很大。如果有些自变量不太重要,开始就不引入,就可减少些计算量再就是旦个自变量被剔除,棍子就把它打死了,它再也没有机会重新进入回归方程。如果说我们的问题涉及的自变量,是完全独立的或不相关,那么在取进出时,前进法与后退法所建的回归方程是相同的。然而在实际中很难碰到自变量间真正无关的情况,尤其是经济问题中,我们所研究的绝大部分问题。自变量间都有定的相关性。这就会使得随着回归方程中变量的增加和减少,些自变量对回归方程的影响也会发生变化。这是因为自变量间的不同组合,由于它们相关的原因,对因变量的影响可能大不样。如果几个自变量的联合效应对有重要作用,但是单个自变量对的作用都不显著,那么前进法就不能引入这只有多组,所以这里取占完全组的百分之十几离散型的用如下方法计算取其中概率最大
下一篇
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
软件度量模型.doc预览图(1)
1 页 / 共 27
软件度量模型.doc预览图(2)
2 页 / 共 27
软件度量模型.doc预览图(3)
3 页 / 共 27
软件度量模型.doc预览图(4)
4 页 / 共 27
软件度量模型.doc预览图(5)
5 页 / 共 27
软件度量模型.doc预览图(6)
6 页 / 共 27
软件度量模型.doc预览图(7)
7 页 / 共 27
软件度量模型.doc预览图(8)
8 页 / 共 27
软件度量模型.doc预览图(9)
9 页 / 共 27
软件度量模型.doc预览图(10)
10 页 / 共 27
软件度量模型.doc预览图(11)
11 页 / 共 27
软件度量模型.doc预览图(12)
12 页 / 共 27
软件度量模型.doc预览图(13)
13 页 / 共 27
软件度量模型.doc预览图(14)
14 页 / 共 27
软件度量模型.doc预览图(15)
15 页 / 共 27
预览结束,还剩 12 页未读
阅读全文需用电脑访问
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
DOC PPT RAR 精品 全部
小贴士:
  • 🔯 当前文档为word文档,建议你点击DOC查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批

搜索

客服

足迹

下载文档