- 无标题文档
查看论文信息

中文题名:

 基于机器学习的古诗词文本隐式意象挖掘    

姓名:

 李勉之    

保密级别:

 公开    

论文语种:

 中文    

学科代码:

 070101    

学科专业:

 数学与应用数学    

学生类型:

 学士    

学位:

 理学学士    

学位年度:

 2019    

学校:

 北京师范大学    

校区:

 北京校区培养    

学院:

 数学科学学院    

第一导师姓名:

 胡韧奋    

第一导师单位:

 北京师范大学中文信息处理研究所    

第二导师姓名:

 刘玉铭    

提交日期:

 2019-05-28    

答辩日期:

 2019-05-20    

中文关键词:

 中国古典诗词 ; 文本分类 ; 机器学习    

中文摘要:
理解中国古典诗词中的隐式意象有助于我们理解语言中浅层语义与深层语义之间的关系。本文主要研究了通过机器学习的数学模型对历代古诗词中的隐式意象标签进行分类。首先利用历代古诗词数据构建了中华传统节日以及历史人物数据集,然后采用平均感知机模型对诗词进行分词,词性标注以及命名实体识别来离散化文本并识别标签,再利用向量空间模型将诗词文本数值化为特征向量,利用卡方检验的方法进行字词的特征选择,最后利用线性支持向量机以及lightGBM模型训练文本分类器,并在两个数据集上分别进行测试,均取得了较好的分类效果。
参考文献总数:

 22    

馆藏号:

 本070101/19187    

开放日期:

 2020-07-09    

无标题文档

   建议浏览器: 谷歌 360请用极速模式,双核浏览器请用极速模式