![]() |
【引言】在数据挖掘及模式识别领域内,有关聚类技术的分析与讨论总是不间断的。而在各种的聚类技术中又以基于划分的聚类算法最为常用。在这些算法中比较著名的有基于模糊理论的模糊聚类算法,最具代表性的有FCM 算法,该类技术被广泛应用于模式识别的各个领域,以此算法为基础又出现了相关的改进算法如AFCM、PFCM和CFCM等算法。无论经过了何种改进,该类算法都始终以模糊划分作为其基础。在1995 年,Li 等人创造性地在C-均值算法的基础上引入了熵的概念,并通过将极大熵应用于最小化均方误差的思想,构造出了新的聚类方法,即极大熵聚类( MEC) 算法。这一方法比以往的聚类技术具有更为简洁的数学表达和明确的物理含义,引发了许多研究人员的兴趣。后来有人以此为基础进行了改进,得到了如MECA、FBACN及RMEC等算法。上述改进算法在一定的领域内有着更好的适用能力,但其本质仍然是以最初的MEC 算法为基础。在经过一系列的研究与分析之后,发现MEC 算法在处理微量级或缩放处理过的数据时,由于其划分的计算策略问题,导致该算法对变化的数据非常敏感,并在数量级达到一定的阶级时,传统MEC 算法得到的聚类中心会发生中心一致的现象,这直接导致了聚类效果的明显恶化,特别在数量级处于毫米级以下时,该算法将直接失效。此问题的存在严重影响了极大熵聚类的适用领域以及面对变化数据的鲁棒性。
知识产权声明 | 服务承诺 | 联系我们 | 人才招聘 | 客服中心 | 充值中心 | 关于我们 Copyright© 中国期刊全文数据库
电子邮件:journals@188.com 备案号:辽ICP备14002692号-1 |