中文题名: | 高维缺失数据的估计与预测——基于美国公用微观数据的实证分析 |
姓名: | |
保密级别: | 公开 |
论文语种: | 中文 |
学科代码: | 071201 |
学科专业: | |
学生类型: | 学士 |
学位: | 理学学士 |
学位年度: | 2020 |
学校: | 北京师范大学 |
校区: | |
学院: | |
第一导师姓名: | |
第一导师单位: | |
提交日期: | 2020-06-17 |
答辩日期: | 2020-05-12 |
中文关键词: | |
中文摘要: |
基于微观数据库的实际数据,探究并比较实证背景下高维缺失数据的估计与预测方法,并进行相应的实证分析。本文使用美国公用微观数据库(PUMS)中马塞诸塞州的全部观测,将“十二个月内个人利息、股息、租金收入”作为响应变量,对存在高缺失值的观测从统计学思维出发加以分析。选取共285个解释变量,分别通过传统回归方法和机器学习算法进行估计和预测。在传统回归方法中,采用基于逆概率加权法的多元线性回归和基于缺失数据插补法的逻辑回归。在机器学习算法中,分别利用GUIDE分类树、支持向量机、BP神经网络的方法,对响应变量进行估计和预测。通过组内验证评估传统方法与机器学习方法下所构建模型的效果,在统计结果基础上加以实证分析。 |
参考文献总数: | 20 |
馆藏号: | 本071201/20004 |
开放日期: | 2021-06-17 |