- 无标题文档
查看论文信息

中文题名:

 一种基于TextRank改进的文本摘要方法    

姓名:

 吕斯琛    

保密级别:

 公开    

论文语种:

 中文    

学科代码:

 070101    

学科专业:

 数学与应用数学    

学生类型:

 学士    

学位:

 理学学士    

学位年度:

 2022    

学校:

 北京师范大学    

校区:

 北京校区培养    

学院:

 数学科学学院    

第一导师姓名:

 刘玉铭    

第一导师单位:

 北京师范大学数学科学学院    

提交日期:

 2022-06-12    

答辩日期:

 2022-05-14    

中文关键词:

 TextRank ; 文本摘要 ; Word2Vec ; TF-IDF    

中文摘要:
大数据时代的到来使得各类数据量级急剧提升,文本类型数据则是其中重要的一种。自动文本摘要技术是自然语言处理当中重要而又热点的研究方向,它可以有效的对大量级的文本数据进行精简和概括,使我们可以更快更好地获取和理解文本的核心内容和观点。TextRank是一种基于图的文本摘要算法,有着易于实现,收敛速度快,无需预先训练等优势。本文基于TextRank算法,以融合Word2Vec词向量嵌入和全局TF-IDF生成权重的方式,提出一种文本摘要的改进方法。改进方法在CNN Daily新闻文本数据集上进行实验,得到了优于传统TextRank算法的结果。

参考文献总数:

 11    

插图总数:

 0    

插表总数:

 0    

馆藏号:

 本070101/22146    

开放日期:

 2023-06-12    

无标题文档

   建议浏览器: 谷歌 360请用极速模式,双核浏览器请用极速模式