中文题名: | 基于机器学习的古诗词文本隐式意象挖掘 |
姓名: | |
保密级别: | 公开 |
论文语种: | 中文 |
学科代码: | 070101 |
学科专业: | |
学生类型: | 学士 |
学位: | 理学学士 |
学位年度: | 2019 |
学校: | 北京师范大学 |
校区: | |
学院: | |
第一导师姓名: | |
第一导师单位: | |
第二导师姓名: | |
提交日期: | 2019-05-28 |
答辩日期: | 2019-05-20 |
中文关键词: | |
中文摘要: |
理解中国古典诗词中的隐式意象有助于我们理解语言中浅层语义与深层语义之间的关系。本文主要研究了通过机器学习的数学模型对历代古诗词中的隐式意象标签进行分类。首先利用历代古诗词数据构建了中华传统节日以及历史人物数据集,然后采用平均感知机模型对诗词进行分词,词性标注以及命名实体识别来离散化文本并识别标签,再利用向量空间模型将诗词文本数值化为特征向量,利用卡方检验的方法进行字词的特征选择,最后利用线性支持向量机以及lightGBM模型训练文本分类器,并在两个数据集上分别进行测试,均取得了较好的分类效果。
﹀
|
参考文献总数: | 22 |
馆藏号: | 本070101/19187 |
开放日期: | 2020-07-09 |