中文题名: | 基于深度嵌入词向量探测词义变化 |
姓名: | |
保密级别: | 公开 |
论文语种: | 英语 |
学科代码: | 070101 |
学科专业: | |
学生类型: | 学士 |
学位: | 理学学士 |
学位年度: | 2020 |
学校: | 北京师范大学 |
校区: | |
学院: | |
第一导师姓名: | |
第一导师单位: | |
第二导师姓名: | |
提交日期: | 2020-06-13 |
答辩日期: | 2020-05-09 |
外文题名: | Lexical Semantic Change based on Deep Contextualized Embeddings |
中文关键词: | |
外文关键词: | semantic change ; deep contextualized embeddings ; clustering |
中文摘要: |
基于词向量的语言模型已经广泛运用在语言学研究中。现有的研究通过有 监督的方法来探测词义的变化。然而,对一些语言而言,不存在权威的词典例 句作为参考。为了解决这一问题,这篇文章针对四种语言(英语,拉丁语,德语 和瑞典语),提出了基于深度嵌入词向量将有监督学习和无监督学习结合起来 的方法来探测词义的变化。我们的目标是判断词语是否在两个时间段内获得 了或者失去了某个含义和对词义的变化程度进行量化评分。实验说明我们的 方法在两项任务上是有显著效果的。 |
外文摘要: |
Recently, word embeddings have been widely used in linguistic studies. The present studies can only detect lexical semantic change with supervised methods. However, for some languages there is no high-quality example sentences for reference. To address this problem, this paper proposes to combine supervised and unsupervised methods which are both based on deep contextualized embeddings to detect semantic change in four languages - English, German, Latin and Swedish. We aim to determine if a word gain or lose sense during two periods of time and quantify the degree of change in word senses. The experiment shows that our method is effective in binary classification and ranking tasks. |
参考文献总数: | 35 |
馆藏号: | 本070101/20096 |
开放日期: | 2021-06-13 |