中文题名: | 基于Python的随机森林算法 |
姓名: | |
保密级别: | 公开 |
论文语种: | 中文 |
学科代码: | 071201 |
学科专业: | |
学生类型: | 学士 |
学位: | 理学学士 |
学位年度: | 2017 |
学校: | 北京师范大学 |
校区: | |
学院: | |
第一导师姓名: | |
第一导师单位: | |
提交日期: | 2017-05-22 |
答辩日期: | 2017-05-10 |
中文关键词: | |
中文摘要: |
本 文 从 机 器 学 习 引 入 介 绍 了 一 些 随 机 森 林 的 基 本 原 理 和 理 论 背
景。随机森林是决策树的一种延伸,也是一种著名的集成学习方法。
其次介绍了随机森林的相关理论,包括强大数定律的应用表明随机
森林的收敛性,克服了决策树中过拟合的问题。同时我们给出了一
个theAmitandGeman(1997)analysis的简化扩展形式来表明随机森林的精度
依赖于每个决策树的强度和他们之间的相关性,即泛化误差界。最后通过经
典的泰坦尼克数据集,基于Python算法进行一个简单的机器学习,利用随机
森林算法解决船上乘客幸存与否的分类问题。
﹀
|
参考文献总数: | 10 |
馆藏号: | 本071201/17028 |
开放日期: | 2017-05-23 |