推荐算法-聚类-均值偏移聚类(爬山算法)
生活随笔
收集整理的这篇文章主要介绍了
推荐算法-聚类-均值偏移聚类(爬山算法)
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
均值偏移(Mean shift)聚类算法是一种基于滑动窗口(sliding-window)的算法,它视图找到密集的数据点。而且,它还是一种基于中心的算法,他的目标是定位每一组群/类的中心点,通过更新中心点的候选点来实现滑动窗口中点的平均值。这些候选窗口在后期处理阶段被过滤,以消除几乎重复的部分,形成最后一组中心点及其对应的组。
下面展示了从端到端所有滑动窗口的这个过程演示。每个黑点代表一个滑动窗口的质心,每个灰色点都是一个数据点。
与K-Means聚类相比,均值偏移不需要选择聚类的数量,因为它会自动地发现这一点。这是一个巨大的优势。聚类中心收敛于最大密度的事实也是非常可取的,因为它非常直观地理解并适合于一种自然数据驱动。缺点是选择窗口大小/半径r是非常关键的,所以不能疏忽。
总结
以上是生活随笔为你收集整理的推荐算法-聚类-均值偏移聚类(爬山算法)的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 推荐算法-聚类-K-MEANS
- 下一篇: 推荐算法-聚类-DBSCAN