数值的三个因素。与上面的结果进行比较。上文也已经提到了,由于人口与妇女生育率的相对稳定,大致上来说,是呈现线性关系的,因此采用多变量的数据拟合的方法对于这个问题来讲,也是比较合适的。至于系数的设置问题,由于条件的改变,需要从新设定,前面的已经不适用。多变量的数据拟合的简介多变量的数据拟合的办法,主要针对的是多个变量同时对个数据产生影响的情况。具体操作如下如果说影响变量的因素不是只有个,而是有几个,比如说有个因素,同时对变量产生影响,这是通过查询得到的组数据可以得到下表编号在般的情况下来说,如果选择的是近似方程为和前面提到的样,把数据代入方程之后将得到个矛盾方程组,所以这里任然利用最小二乘法的原理来确定方程中的全部系数。使得,要求要使得,达到极小。将式子,分别对,求偏微商,而且分别令,的偏微商等于就得到也就是说这也是个正规方程组。当然这个这个正规方程组经过简化整理可以得到另种形式,该形式如下在这之中,,通过求解线性方程组即可以求得再从式子计算出,通过这两个方程组就可以求得全部的系数了。因为通常我们假设观测数据的数组大于自变量的个数即,并且假设任自变量都不能用其他自变量的线性表出,这时方程总有唯解。这就是多变量拟合的般过程和原理,大体上看来与最小二乘法是差不多的,只是变量的个数多了些。接下来就是利用多变量数大学出版社,徐泽水不确定多属性决策方法及应用北京清华大学出版社,王应明应用离差最大化方法进行多指标决策与排序系统工程与电子技术徐萃微,孙绳武计算方法引论,北京高等教育出版社,致谢在论文结束之际,我要大力感谢李强老师对于本篇论文的严格审核,不厌其烦的指出了文章中的纰漏和,并给与了我大量的指导意见,让这篇存在着大量和漏洞的拙文变得流利通畅,在这里,我要再次感谢李强老师次次的辛勤付出,在百忙之中抽出时间指导我的写作。在李强老师的帮助之下我顺利完成了这篇文章同时也非常感谢汪新凡老师赵育林老师以及其他任课老师的帮助据的拟合方法解决分孩次生育率与人口总量的数据拟合问题。多变量的数据拟合的系数设置与前面的最小二乘法数据拟合相比,多变量的数据拟合问题的系数有所不同,前面自由个变量就是妇女生育率,而这里就涉及到了三个数据变量,他们分别是孩生育率,二孩生育率,以及三孩生育率。同样的,为了不使数据溢出影响精度,仍然把人口总量作为因变量,而把妇女生育率作为自变量,因此,在这里把人口总量设置为,把孩生育率设置为,把二孩生育率设置为,把三孩生育率设置为。因此这里涉及到组数据。利用多变量的数据拟合求解在前文中已经已经查询到了关于年直到年七年的人口总量以及这几年的妇女生育的数据,这些数据如下表所示编号现在选择的近似方程是这是个线性方程,现在用最小二乘法的原理来确定系数,也就是要使得,取得极小值,为此,分别对,求偏微商,而且令他们的偏微商为得正规方程组由解得即,。程序代码,,,,,,,,,,,,解得的近似方程为这里把多属性的数据拟合函数解出来了,仍然要对其进行检测,所选取得年份仍然是年,从上文可以看到年我国的孩生育率是,二孩生育率是,三孩生育率是,当年的人口总量是万人,把分孩次生育率代入到刚才的近似方程中,解得的结果是万,与实际人口数量的偏差为万,误差是比较大的,比直接用最小二乘法解得的数据误差大些,因此用最小二乘法解更加的合适。小结本文利用最小二乘法和多变量的数据拟合的方法来求解分孩次生育率与人口总量之间的函数关系,首先查询得到历年的人口数据,然后是查询得到历年的妇女生育率的数值,利用离差最大化的决策方法来给分孩次的妇女生育率加权,使各孩次的贡献程度比较直观的表示出来了。最后是分别用最小二乘法和多变量的数据拟合的方法分别拟合函数,并做个比较,最终的结果是使用最小二乘法的效果比使用多变量的数据拟合的方法误差要小,在本文的条件下,使用最小二乘法来拟合函数是比较适合的。参考文献中国人口统计年鉴年年国家统计局中国统计年鉴年年国家统计局李勇胜人口统计学成都西南财经大学出版社,温勇人口统计学南京东南排序的作用越小。反之则说明该属性对于排序来说起着更大的作用。因此,从方案排序的方面来讲,偏差值越大的属性应该赋予更大的权重。特别的,若所有方案在属性下的属性值无差异,则该属性对于方案的排序来说是不起任何作用,可令其权重为,而离差最大化的方法正是在这前提条件下通过计算方案的离差,并求解方案的离差模型达到最优值而求解出最终的结果。但是考虑到本篇文章的特殊性,即不需要对方案进行最后的排序,只需要在计算出权重属性后计算出各年的决策属性值即可,因此舍去了决策分析的最后过程,具体的步骤如下步骤对于个多属性决策问题,我们首先需要做的是要构造个决策矩阵,并利用适当的方法把它规范化为规范化的方法为如果属性权重的类型是效益型,即属性值越大越好的属性,那么或者若属性权重值是成本型,也就是说属性值越小越好的属性,那么或者其中,为各个方案,为属性效益型以及成本型由此得到我的规范化矩阵步骤利用公式,计算出各方案的最优权重向量,,属性权重值就算出来了步骤根据上步所计算出来的属性权重值给各个方案进行加权,以此计算出来的结果即是每个属性的综合决策属性值。由于本文并不需要对各年的妇女生育率属性进行排序,所以最后的步骤也就是排序的步骤就省略了。由计算所得的决策权重计算各年的综合决策值步骤由上述提到的离差最大化的决策步骤计算得出本文之中的妇女生育率的规范化矩阵如下表,考虑到我国的实际情况是既要保证繁衍,又不能是人口总量超过环境的承载能力,在这种情况下我认为把孩生育率设置为效益型,而把二孩生育率与三孩生育率设置为成本型。年年年年年年年孩二孩三孩这就是利用上文提到的规范化方法而计算出的规范化矩阵步骤计算得出规范化矩阵后就可以直接利用公式求出决策属性值,但是为了更加直观的求解出决策属性的权重值,我将先计算出公式的上半部分也就是要计算计算出的矩阵如下表年年年年年年年孩二孩三孩然后再利用公式,计算出决策权重,决策权重为属性孩生育率的决策权重值是,属性二孩生育率的决策权重值是,属性三孩生育率的决策权重值是步骤根据离差最大化得到,应该满足的方程即这俩个方程称为那些直线系数的正规方程组。解方程可以得出和,直线方程就可以确定出来了。最终的结果就求解出来了总结前面的简介,现将上面的例子的计算步骤整理如下第步由数据,计算以及,列成个表格。第二步将表中每列的数据相加之后写在表格的最后行。第三步写出正规方程。第四步解方程组求出和。系数设置在这篇文章中主要涉及到两个变量,个是人口总量,另个是妇女生育率但是人口总量的数量级是比较大的,如果是把人口总量作为自变量,妇女生育率作为因变量就会导致计算出的拉格朗日型插值函数的数量级过高而导致计算出的结果太大因此我把人口总量作为因变量,把妇女生育率作为自变量,这样既不会导致数量级太大而影响精度,也方便了计算各年的妇女生育率按年到年的顺序分别设置为把人口总量按年年的顺数分别设置为,最小二乘法数据拟合根据前面的步骤,第步是要绘制出表格,由上面的条件得出的表格如下编号这篇文章的正规方程是把上表格的数据代入到这个正规方程里面,则有根据这两个方程组就可以求解出和。采用代入法消元得到,。所以,计算出来的线性方程是为了降低计算量,此处计算出的结果只精确到小数点后面的两位,因此降低计算量值后的线性方程是接下来就是验证,解出的线性方程组的效果是否足够,这里利用年的数据进行验证,查询得到年的孩生育率是,二孩生育率是,三孩生育率是。而年的人口总量是万人。把生育率数据放入到前面的离差最大化的决策步骤中,得到加权之后的妇女生育率是,把代入到上面的线性方程中,得到人口总量的数据是,与当年的万的人口相比,多出了万,可以看多数据还是比较接近,这说明在人口增长相对稳定的状况下,利用最小二乘法求解人口总量是比较精确的。多变量的数据拟合上面已经利用最小二乘法求解分孩次生育率与人口总量的线性函数关系了决策方法的决策方法以及上步的决策权重值计算出各年的加权之后的妇女生育率,计算的结果如下年年年年年年年生育率这就是给各年的分孩次生育率赋予权值之后的结果,仔细的分析观察之后可以看到这个结果确实有其不合理的地方