- 无标题文档
查看论文信息

中文题名:

 跨语言知识图谱的概念体系构建    

姓名:

 曹书林    

保密级别:

 公开    

论文语种:

 中文    

学科代码:

 080901    

学科专业:

 计算机科学与技术    

学生类型:

 学士    

学位:

 理学学士    

学位年度:

 2019    

学校:

 北京师范大学    

校区:

 北京校区培养    

学院:

 信息科学与技术学院    

第一导师姓名:

 王志春    

第一导师单位:

 北京师范大学信息科学与技术学院    

第二导师姓名:

 李涓子    

提交日期:

 2019-06-11    

答辩日期:

 2019-05-14    

外文题名:

 Taxonomy Construction for Cross-lingual Knowledge Graph    

中文关键词:

 跨语言知识图谱 ; 概念体系 ; 维基百科类别网络 ; 对抗训练    

中文摘要:
基于维基百科构建概念体系是跨语言知识图谱构建的重要研究方向之一。现有的方法将概念体系构建当作分类任务,有两个缺点:(1)依赖于英文概念体系和维基百科跨语言链接,面临错误传播问题和跨语言链接数量不足问题;(2)分类器仅仅以词条和类别的标题作为输入,难以捕获上下位语义信息。针对以上两个问题,本文提出了基于对抗训练的无监督训练方法,摆脱对英文概念体系和维基百科跨语言链接的依赖,并且提出在分类器中对维基百科类别网络的图结构特征进行编码,捕获更精准的上下位语义信息。在英文维基百科上的实验结果表明,本文提出的方法可以构建较高质量的知识图谱概念体系,效果高于当前最先进的跨语言知识图谱概念体系方法。
外文摘要:
Taxonomy construction for cross-lingual knowledge graph based on Wikipedia is an important research area recently. The state-of-the-art method regards taxonomy construction as a binary classification problem and makes multilingual taxonomy construction possible. However, there exists two main issues: (1) existing method relies on English gold taxonomy and cross-lingual links, thus suffers from error propagation and data sparsity problem. (2) existing method cannot capture taxonomic relation accurately. We propose an unsupervised classifier based on adversarial training, thus breaking out of dependency on English gold taxonomy and cross-lingual links. The encoding of various structure features based on Wikipedia Category Network also helps to capture taxonomic relation. Experiments on English taxonomy construction demonstrate that our approach outperforms the state-of-the-art approaches.
参考文献总数:

 25    

馆藏号:

 本080901/19012    

开放日期:

 2020-07-09    

无标题文档

   建议浏览器: 谷歌 360请用极速模式,双核浏览器请用极速模式