最新资讯

您现在的位置: 首页 > 动态 > 文章正文动态

    kmeans算法(kmeans聚类标签怎么打)

    发布时间:2022-10-20 23:25 点击:

      ① 在 K-means 算法中 K 是事先给定的,这个 K 值的选定是非常难以估计的。很多时候,事先并不知道给定的数据集应该分成多少个类别才最合适。

      这也是 K-means 算法的一个不足。

      有的算法是通过类的自动合并和分裂,得到较为合理的类型数目 K,例如 ISODATA 算法。关于 K-means 算法中聚类数目K 值的确定在文献中,是根据方差分析理论,应用混合 F统计量来确定最佳分类数,并应用了模糊划分熵来验证最佳分类数的正确性。

      在文献中,使用了一种结合全协方差矩阵的 RPCL 算法,并逐步删除那些只包含少量训练数据的类。

      而文献中使用的是一种称为次胜者受罚的竞争学习规则,来自动决定类的适当数目。

      它的思想是:对每个输入而言,不仅竞争获胜单元的权值被修正以适应输入值,而且对次胜单元采用惩罚的方法使之远离输入值。

      ② 在 K-means 算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化。

      这个初始聚类中心的选择对聚类结果有较大的影响,一旦初始值选择的不好,可能无法得到有效的聚类结果,这也成为 K-means算法的一个主要问题。对于该问题的解决,许多算法采用遗传算法(GA),例如文献 中采用遗传算法(GA)进行初始化,以内部聚类准则作为评价指标。

      ③ 从 K-means 算法框架可以看出,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的。所以需要对算法的时间复杂度进行分析、改进,提高算法应用范围。

      在文献中从该算法的时间复杂度进行分析考虑,通过一定的相似性准则来去掉聚类中心的侯选集。

      而在文献中,使用的 K-means 算法是对样本数据进行聚类,无论是初始点的选择还是一次迭代完成时对数据的调整,都是建立在随机选取的样本数据的基础之上,这样可以提高算法的收敛速度。

      上一篇:苹果直营店地址(苹果在中国有几家直营店)

      下一篇:王者荣耀云端梦境(云端梦境最快几天完成)

苹果直营店地址(苹果在中国有几家直营店) 瓷砖背景墙效果图(瓷砖背景墙好不好,它的缺点和优点?还有造 谈恋爱门当户对重要吗(一段感情门当户对重要吗) 摩托车机车(摩托车驾驶证过期8年了不注销能学C1吗) 前列腺炎多吃八种食物(前列腺炎患者多吃什么) potato土豆聊天安卓版(土豆聊天potato为什么用不了?一直连接不上 刺激战场国际服怎么加速(国内服务器国外访问速度慢怎么办) 产后康复培训(产后康复师教学课程内容都有些什么) 探歌怎么样(探歌这车怎么样?值得买么) 啄木鸟家庭维修(啄木鸟家电维修靠谱吗)