子公司分配医疗保障基金数额的多元统计回归模型 国家自然科学基金isis

  【摘要】本文根据实际情况和背景信息,对医疗保障基金数额的分配问题进行了建模分析。建立了多元统计回归模型:yij=β0+β1xi+β2xi2+…+βnxin+εi;并且利用多种检验方法,对模型进行改进,从而提高预测准确度;最后为了检验随机变量是否存在自相关性问题,使用了D-W检验,准确的解决了实际问题。
  【关键词】基金数额分配多元统计回归模型D-W检验
  【中图分类号】R195【文献标识码】A【文章编号】1006-9682(2010)08-0189-03
  
  一、引 言
  现在市场经济发展充分的条件下,各集团规模日益增大,集团内的管理和规定不能完全细致化,因此各子公司的财务方面逐渐进行独立核算。本文针对某集团下设四个子公司:子公司A、子公司B、子公司C和子公司D。在各子公司财务独立核算的前提下,每个子公司都实施了对雇员的医疗保障计划,由各子公司自行承担雇员的全部医疗费用。根据过去的统计数据表明,每个子公司的雇员人数以及每一年龄段的雇员比例,在各年度都保持相对稳定。
  集团为了使各个子公司的医疗保障计划进一步规范,要求各个子公司均需以银行活期存款的方式,设立医疗保障基金,基金专门用于支付下一年度雇员的医疗费用,并规定每个子公司的医疗保障基金只能用于支付本子公司雇员。假设下一年的银行活期存款利率为1%。根据董事会综合考虑各种因素,确定本集团设立的下一年度医疗保障基金的总额度为80万元,这一额度在四个子公司之间分配。对于各子公司,如果下一年度总的医疗费用支出低于该子公司的医疗保障基金的额度,则雇员可以及时得到医疗方面的保障。而如果总的医疗费用超过了医疗保障基金的额度,则子公司需要通过其他渠道来筹措超出部分的额度。这会导致某些雇员无法及时报销医疗费用。同时根据实际情况,每年都存在一定程度的通货膨胀。
  二、模型的合理假设
  1.各子公司自行承担雇员的全部医疗费用。
  2.每个子公司的雇员人数以及每一年龄段的雇员比例在各年度都相对稳定。
  3.每年每个子公司的医疗费用支出低于该子公司的医疗保障基金的额度。
  4.模型的随机误差项εi对时间t相互独立。
  三、模型的建立与求解
  由于各子公司自行承担雇员的全部医疗费用,所以他们的费用支出之间并没有什么联系。而同时基金的分配和对应年份的通货膨胀率密切相关,因此在研究各个因素对基金分配的影响时,要考虑通货膨胀率与基金分配额之间的关系。若记Yij为第i年的j公司的医疗费支出,xi为第i年的通货膨胀指数。
  为了分析问题的方便,先分别考虑因变量和各自变量之间的关系,利用MATLAB软件做出因变量Yij与自变量xi的对应散点图:[1~3]
  
  图1Yi1对xi的散点图图2Yi2对xi的散点图
  
  图3Yi3对xi的散点图 图4Yi4对xi的散点图
  由图1、图2、图3、图4,观察可知随着xi的增加,Yij的值有比较明显的线性增长趋势,建立一元线性回归模型:
  Yij=β0j+β1jxi+εj (j=1,2,3,4)(1)
  直接利用MATLAB统计工具箱的命令regress求解,
  [b,bint,r,rint,s]=regress(Y,X,alpha)
  其中b为βj的估计值,bint为b的置信区间,r为残差向量,rint为r的置信区间,s为回归模型的检验统计量,alpha为置信水平,缺省时取值0.05。[4,5]
  得到模型(1)的回归估计值以及置信区间(置信水平a=0.05)、检验统计量R2,F,P的结果,见表1。
  表1模型1的计算结果
  Yi1 参数参数估计值参数置信区间
  β01-2.8076-4.2180-1.3971
  β110.10300.09490.1110
  R2=0.9699 F=708.6355 p 本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文   x25=105.3225+5.3209×25=238.345
  根据模型(1),可分别计算得:
  Y25,1=21.74, Y25,2=18.47, Y25,3=26.19;
  根据模型(2)及表4,可分别计算得:Y25,4=15.3378;
  由于
  Y25,1+Y25,2+Y25,3+Y25,4=21.74+18.47+26.19+15.3378
  =81.7302>80×(1+1%)=80.8;
  按照比例分配把80.8万元分配给A、B、C、D子公司,得到如下:
  Y25,1=21.4858, Y25,2=18.2718, Y25,3=25.8791, Y25,4=15.1632。
  四、结果分析与模型的改进
  令εt=ρεt-1+ut,其中ρ是自相关系数,|ρ|≤1,ut相互独立且服从均值为零的正态分布。
  D-W检验是一种常用的诊断自相关现象的统计方法,D-W统计量如下:
  (其中)(4)
  当n较大时:
  (5)
  其中右端的正是自相关系数ρ的估计值,于是:
  DW≈2(1-) (6)
  当在0附近时,εt自相关性很弱;
  当在±1附近时,εt自相关性很强。
  由6式算出各公司残差ei的自相关系数,见表4:
  表4式6的计算结果
  公 司ABCD
  ρ0.53410.65460.55890.1173
  令:;
  (1)(2)式化为:
  (7)
  (8)
   (9)
  根据模型(7、8),可分别计算得:
  Y25,1=21.9327, Y25,2=18.1491, Y25,3=26.4817, Y25,3=15.2822;
  由于:
  Y25,1+Y25,2+Y25,3+Y25,4=81.8457>80×(1+1%)=80.8;
  按照比例分配把80.8万元分配给A、B、C和D子公司,得到如下:
  Y25,1=21.6525,Y25,2=18.4822,Y25,3=26.1434,Y25,4=15.0869。
  同时对改进前后两个模型对通货膨胀指数的预测做了对比分析,结果见表5。通过表5可看出,改进后的模型的预测结果更接近实际情况,残差更集中在0点处。
  五、结 论
  可以根据实际情况和背景信息,对问题建立多元统计回归模型,利用各种检验方法,对模型进行改进,从而提高预测准确度,为了检验随机变量是否存在自相关性问题,使用D-W检验,准确的解决了实际问题。
  表5改进前模型与改进后模型的计算结果对比
  实际值旧模型新模型残差(旧)残差(新)
  18.287.48888.24810.791210.031944
  28.768.00368.2310.75640.52901
  39.299.03329.00870.256760.28128
  410.7310.37210.2460.358240.48369
  510.8810.57810.3770.302310.50337
  611.3411.60711.405-0.26733-0.065083
  711.9712.63712.455-0.66696-0.48453
  812.0212.7412.549-0.71993-0.52903
  912.1612.84312.65-0.68289-0.48951
  1012.8313.66713.505-0.8366-0.67466
  1113.915.21115.113-1.3111-1.213
  1214.7115.72615.649-1.0159-0.93869
  1316.1115.82915.7550.281170.35452
  1416.415.93215.8630.46820.53746
  1517.0716.65316.6140.417460.45616
  1616.9616.85816.8280.101530.13154
  1716.8817.47617.473-0.59625-0.59253
  1817.217.78517.795-0.58514-0.59456
  1919.8718.81518.8681.05521.0019
  2020.1918.91818.9751.27231.2146
  212019.3319.4050.670410.59519
  2219.8119.53619.620.274480.19049
  2319.419.74119.834-0.34145-0.43422
  2420.4820.46220.5860.017808-0.10568
  参考文献
  1 王 岩、隋思涟、王爱青.数理统计与MATLAB工程数据分析[M].北京:清华大学出版社,2006
  2 张恒喜、郭基联、朱家元、虞健飞.小样本多元数据分析方法及应用[M].西安:西北工业大学出版社,2002
  3 吾今培、孙德山.现代数据分析[M].北京:机械工业出版社,2006
  4 余锦华、杨维权.多元统计分析与应用[M].广州:中山大学出版社,2006
  5 姜启源、谢金星、叶 俊.数学模型[M].北京:高等教育出版社,2004
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文