1 符号说明
2 引言
中国从 1971 年开始全面开展了计划生育,使中国总和生育率很快从 1970 年 的 5.8 降到 1980 年 2.24,接近世代更替水平。此后,人口自然增长率(即人口 的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相 关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律, 与猜测中国未来的增长趋势,需要建立计量经济学模型。 影响中国人口自然增长率的因素有很多,但根据分析主要因素有:(1)从宏 观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它 的高低可能会间接影响人口增长率。(3)文化程度,由于教育年限的高低,相应 会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业 与农业人口的比率也会对人口增长率有相应的影响。 为了全面反映中国“人口自然增长率”的全貌,我们选择人口自然增长率作 为被解释变量,以反映中国人口的增长;选择“国民总收入”和“人均 GDP”作 为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的 代表。暂不考虑文化程度及人口分布的影响。
3 数据采集和模型选择
3.1 数据采集
从《中国统计年鉴》收集到以下数据(见表 2):
3.2 模型选择
选取人口自然增长率做为因变量 Y,选择国民总收入、居民消费价格指数增长率和人均 GDP 作为自变量,其中对应关系在表 1 中已明确列举。
设定的线性回归模型为:
4 数据分析
通过 Excel 输出计算结果表 3、表 4、表 5。其基本内容包括以下三个部分: 6 第一部分“回归统计”反映整个回归方程拟合的情况(见表 3),具体包含 Multiple R:相关系数 r,一般在-1-1 之间,绝对值越靠近 1 则相关性越强,越 靠近 0 则相关性越弱;R square:相关系数 r 的平方,表达自变量解释因变量变 差的程度,以测定量 y 的拟合效果;Adjusted R Square:调整后的 R square, 说明自变量能说明因变量百分比,和 R square 的区别在于,通常一元回归的时 候看 R square 项多,而多元回归时候看 Adjusted R Square 项多;标准误差: 用来衡量拟合程度的大小,也用于计算与回归相关的其它统计量,此值越小,说 明拟合程度越好;观察值:用于训练回归方程的样本数据有多少个;
第二部分是方差分析表(见表 4),主要作用是通过 F 检验来判定回归模型 的回归效果。主要关注回归分析这一行的 Significance F(F 显著性统计量) 的 P 值,以统计常用的 0.05 显著水平为例,这里的 4.29E-06 明显小于 P=0.05,则 F 检验通过,整个回归方程显著有效。
第三部是回归系数的估计值(见表 5)。Coefficients(回归系数): intercept 对应截距项;标准误差:误差值越小,表明参数的精确度越高。不 常使用,原因在于:其统计信息已经包含在后述的 t 检验中;t stat:T 检验 中统计量 t 值,用于对模型参数的检验,需要查表才能决定。t 值是回归系数 与其标准误差的比值。经常一元回归可以看 F 检验或者回归统计基本能支撑判 断,但对于多元线性回归,t 检验就不可缺省;P-value:T 检验对应的 P 值, 当 P<0.05 时,可以认为模型在 α=0.05 的水平上显著,或者置信度达到 95%;当 P<0.01 时,可以认为模型在 α=0.01 的水平上显著,或者置信度达到 99%; Lower 95% /Upper 95% /下限 99.0% /上限 99.0% : 95%置信区间的上下限 值。
根据表 5 中数据,多元线性回归模型估计的结果为:
举报
评论 5