模糊k-means算法的模糊因子是怎么回事?

发布网友 发布时间:2022-04-01 10:22

我来回答

1个回答

热心网友 时间:2022-04-01 11:51

模糊kmeans算法是kmeans聚类模糊形式。与kmeans算法排他性聚类不同,模糊kmeans尝试从数据集中生成有重叠的簇。在研究领域,这也叫做模糊c-means算法,可以把模糊kmeans看作kmeans算法的扩展。

kmeans致力于寻找硬簇(一个数据集点只属于某一个簇)。在一个软聚类算法中,任何点都属于不止一个簇,而且该点到这些簇之间都有一定大小的吸引度。这种吸引度与该点到这个簇中心距离成比例。

mahout中实现部分也是FuzzyKMeansClusterer 和 FuzzyKMeansDriver 一个是in-memory的一个是maprece 的。

模糊kmeans有一个参数m ,叫做模糊因子。与kmeans不同的是,模糊因子引入不是把向量分配到最近的中心,而是计算每个点到每个簇的关联度。

假设一个向量V,到k个簇的距离分别为d1,d2。。。dk。向量V到第一簇的关联度计算如下:


这个公式也就是表达意思:如果越接近该向量簇中心,就会得到更高的权重。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com