- 无标题文档
查看论文信息

中文题名:

 高维缺失数据的估计与预测——基于美国公用微观数据的实证分析    

姓名:

 王一然    

保密级别:

 公开    

论文语种:

 中文    

学科代码:

 071201    

学科专业:

 统计学    

学生类型:

 学士    

学位:

 理学学士    

学位年度:

 2020    

学校:

 北京师范大学    

校区:

 北京校区培养    

学院:

 统计学院 ; 国民核算研究院    

第一导师姓名:

 童行伟    

第一导师单位:

 北京师范大学统计学院    

提交日期:

 2020-06-17    

答辩日期:

 2020-05-12    

中文关键词:

 缺失数据 ; 逆概率加权 ; GUIDE分类树 ; BP神经网络    

中文摘要:

基于微观数据库的实际数据,探究并比较实证背景下高维缺失数据的估计与预测方法,并进行相应的实证分析。本文使用美国公用微观数据库(PUMS)中马塞诸塞州的全部观测,将“十二个月内个人利息、股息、租金收入”作为响应变量,对存在高缺失值的观测从统计学思维出发加以分析。选取共285个解释变量,分别通过传统回归方法和机器学习算法进行估计和预测。在传统回归方法中,采用基于逆概率加权法的多元线性回归和基于缺失数据插补法的逻辑回归。在机器学习算法中,分别利用GUIDE分类树、支持向量机、BP神经网络的方法,对响应变量进行估计和预测。通过组内验证评估传统方法与机器学习方法下所构建模型的效果,在统计结果基础上加以实证分析。

参考文献总数:

 20    

馆藏号:

 本071201/20004    

开放日期:

 2021-06-17    

无标题文档

   建议浏览器: 谷歌 360请用极速模式,双核浏览器请用极速模式