中文题名: | 规则的信息量及其在数据挖掘中的应用 |
姓名: | |
保密级别: | 公开 |
学科代码: | 070104 |
学科专业: | |
学生类型: | 博士 |
学位: | 理学博士 |
学位年度: | 2005 |
学校: | 北京师范大学 |
校区: | |
学院: | |
研究方向: | 数据挖掘 |
第一导师姓名: | |
第一导师单位: | |
提交日期: | 2005-06-10 |
答辩日期: | 2005-06-02 |
外文题名: | The Information Content of Rules And Its Application in Data Mining |
中文关键词: | |
中文摘要: |
本文全面地讨论了清晰规则,模糊事件,模糊规则的信息量,并将这些新的度量公式成功地应用于数据挖掘。本文主要分为四个部分:第一部分:详细讨论了清晰规则信息量的度量。该部分包括两章(2-3章)。规则本质上是一个建立于条件和决策之间的关系。因此,要度量规则的信息量,我们首先应讨论关系的信息量。在第二章中,我们集中讨论了n元关系的信息熵及其相关性质。并在此基础上,对谓词,尤其是多元谓词的信息量进行了度量。进一步地,我们利用关系的信息熵给出了一个新的决策树学习算法。通过与经典的决策树学习算法ID3的比较,我们发现,新
﹀
|
外文摘要: |
At first, we give a measure to scale the entropy of n-ary relations on finite universe. The properties of the new measure are discussed in details. Based on the measure, we can scale the information content of predicates and propositions, especially the n
﹀
|
参考文献总数: | 60 |
馆藏地: | 图书馆学位论文阅览区(主馆南区三层BC区) |
馆藏号: | 博070104/0503 |
开放日期: | 2005-06-10 |