中文题名: | 一种基于TextRank改进的文本摘要方法 |
姓名: | |
保密级别: | 公开 |
论文语种: | 中文 |
学科代码: | 070101 |
学科专业: | |
学生类型: | 学士 |
学位: | 理学学士 |
学位年度: | 2022 |
学校: | 北京师范大学 |
校区: | |
学院: | |
第一导师姓名: | |
第一导师单位: | |
提交日期: | 2022-06-12 |
答辩日期: | 2022-05-14 |
中文关键词: | |
中文摘要: |
大数据时代的到来使得各类数据量级急剧提升,文本类型数据则是其中重要的一种。自动文本摘要技术是自然语言处理当中重要而又热点的研究方向,它可以有效的对大量级的文本数据进行精简和概括,使我们可以更快更好地获取和理解文本的核心内容和观点。TextRank是一种基于图的文本摘要算法,有着易于实现,收敛速度快,无需预先训练等优势。本文基于TextRank算法,以融合Word2Vec词向量嵌入和全局TF-IDF生成权重的方式,提出一种文本摘要的改进方法。改进方法在CNN Daily新闻文本数据集上进行实验,得到了优于传统TextRank算法的结果。
﹀
|
参考文献总数: | 11 |
插图总数: | 0 |
插表总数: | 0 |
馆藏号: | 本070101/22146 |
开放日期: | 2023-06-12 |