- 无标题文档
查看论文信息

中文题名:

 基于部分监督改进的模糊C均值聚类算法    

姓名:

 段灵子    

保密级别:

 公开    

学科代码:

 070101    

学科专业:

 数学与应用数学    

学生类型:

 学士    

学位:

 理学学士    

学位年度:

 2015    

学校:

 北京师范大学    

校区:

 北京校区培养    

学院:

 数学科学学院    

研究方向:

 模糊数学    

第一导师姓名:

 于福生    

第一导师单位:

 北京师范大学数学科学学院    

提交日期:

 2015-05-15    

答辩日期:

 2015-05-15    

中文关键词:

 模糊聚类 ; 模糊C均值算法 ; 部分监督 ; 划分矩阵 ; 聚类有效性    

中文摘要:
针对模糊C均值聚类算法需要给定聚类数目、对初值敏感的缺点,本文结合部分监督思想改进了传统的模糊C均值聚类算法。首先对数据进行模糊C均值聚类,然后通过分析划分矩阵中各行的数据特点,选出清晰类,并将其类中心作为标签数据保存用以指导最终的聚类;同时结合划分矩阵中各列的数据特点,评价聚类结果的有效性,调整类数,对剔除清晰类的数据再次进行模糊聚类。重复上述过程至达到循环终止条件,最终根据标签数据进行原始数据的部分监督模糊聚类,得到符合数据内在结构的聚类结果。本文将改进的算法在3个人工数据集和1个真实数据集上进行试验,并与传统模糊C均值聚类结果对比,结果表明改进后的算法有效地避免了初值敏感,得到了较为自然的聚类结果。
外文摘要:
Aiming to reduce the sensitivity to the initial cluster centers of fuzzy C-means clustering and avoid determining the number of clusters in advance, a method based on the partially supervised fuzzy clustering is proposed in this paper. First, the data is clustered with fuzzy C-means clustering. Then each row of the partition matrix is analyzed to select the clear clusters, and save their centers as knowledge for the clustering. Combining the analysis of each column and row of the partition matrix, the clustering result is evaluated to adjust the number of clusters. Next, the unclear clusters are clustered again with the adjusted number. This process is repeated until the terminating condition is reached. Finally, use the partially supervised fuzzy clustering to cluster the original data with those saved centers. The method is tested on 3 self-defined datasets and a real dataset, with comparison to the traditional fuzzy C-means clustering results. It is shown that the improved method is insensitive to the initial value and can get an appropriate clustering result.
参考文献总数:

 18    

插图总数:

 11    

插表总数:

 0    

馆藏号:

 本070101/1513    

开放日期:

 2015-05-15    

无标题文档

   建议浏览器: 谷歌 360请用极速模式,双核浏览器请用极速模式