- 无标题文档
查看论文信息

中文题名:

 基于Python的随机森林算法    

姓名:

 李成茹    

保密级别:

 公开    

论文语种:

 中文    

学科代码:

 071201    

学科专业:

 统计学    

学生类型:

 学士    

学位:

 理学学士    

学位年度:

 2017    

学校:

 北京师范大学    

校区:

 北京校区培养    

学院:

 数学科学学院    

第一导师姓名:

 吕绍川    

第一导师单位:

 北京师范大学统计学院    

提交日期:

 2017-05-22    

答辩日期:

 2017-05-10    

中文关键词:

 机器学习 ; 数据挖掘 ; 非参数估计 ; 随机森林 ; 集成学习 ; 决策树    

中文摘要:
本 文 从 机 器 学 习 引 入 介 绍 了 一 些 随 机 森 林 的 基 本 原 理 和 理 论 背 景。随机森林是决策树的一种延伸,也是一种著名的集成学习方法。 其次介绍了随机森林的相关理论,包括强大数定律的应用表明随机 森林的收敛性,克服了决策树中过拟合的问题。同时我们给出了一 个theAmitandGeman(1997)analysis的简化扩展形式来表明随机森林的精度 依赖于每个决策树的强度和他们之间的相关性,即泛化误差界。最后通过经 典的泰坦尼克数据集,基于Python算法进行一个简单的机器学习,利用随机 森林算法解决船上乘客幸存与否的分类问题。
参考文献总数:

 10    

馆藏号:

 本071201/17028    

开放日期:

 2017-05-23    

无标题文档

   建议浏览器: 谷歌 360请用极速模式,双核浏览器请用极速模式