目录
百战程序员,全站22050+开发课程+文档 ,学习精选优质好课快人一步!观看视频 快捷键ALT+N

Python全系列 教程

3567个小节阅读:5929.2k

收藏
全部开发者教程

鸿蒙应用开发

C语言快速入门

JAVA全系列 教程

面向对象的程序设计语言

Python全系列 教程

Python3.x版本,未来主流的版本

人工智能 教程

顺势而为,AI创新未来

大厂算法 教程

算法,程序员自我提升必经之路

C++ 教程

一门通用计算机编程语言

微服务 教程

目前业界流行的框架组合

web前端全系列 教程

通向WEB技术世界的钥匙

大数据全系列 教程

站在云端操控万千数据

AIGC全能工具班

A

A A

White Night

阅读(511)
赞(0)

K-Means聚类分析

image-20221226151454539

K-Means聚类分析的核心步骤

K-Means聚类也称快速聚类,它有效解决了其他聚类分析(例如层次聚类)执行效率低下的问题。因此,K-Means聚类是目前应用最为广泛的聚类分析方法。

  1. 指定聚类数目K

  2. 确定K个初始类中心点

  3. 根据距离最近原则进行分类

  4. 重新确定K个类中心点

  5. 判断是否已经满足终止聚类分析的条件

    • 迭代次数
    • 类中心点偏移程度

    上述两个条件中任意一个满足则结束聚类,如果均不满足,则回到第三步

【案例】—— 31省市自治区小康和现代化指数的K-Means聚类分析

对地区进行K-Means聚类分析,要求分成3类,初始类中心点由SPSS自行确定

  1. 选择菜单【分析】----> 【分类】----> 【K-均值聚类】

  2. image-20221226160504150

    选定参与K-Means聚类的变量到【变量(V)】框中,选择一个字符串型变量作为标记变量到【个案标注依据(B)】框中。标记变量将大大增强聚类分析结果的可读性。在【聚类数(U)】框中输入聚类数目,在【方法】框中指定聚类过程是否调整类中心点。

  3. 点击【迭代(I)】按钮确定终止聚类的条件

    image-20221226161231051

  4. 点击【保存(S)】按钮,将聚类分析的部分结果以SPSS变量的形式保存到数据编辑器窗口中

    image-20221226161409882

  5. 点击【选项(O)】按钮,确定输出哪些分析结果

    image-20221226161733490

  6. 点击“确定”,分析结果如下

    image-20221226162048075

上表展示了3个类的初始类中心点的情况

image-20221226162258273

上表展示了3个类中心点每次迭代时的偏移情况

image-20221226162529593

上表展示了3个类的最终类中心点的情况

image-20221226163254349

ANOVA表中的内容表示以聚类分析产生的类为控制变量,以聚类变量为观测变量进行单因素方差分析。上表各数据项的含义依次为组间方差、组间自由度、组内方差、组内自由度、F统计量的观测值以及对应的概率P值。该表显示各指数的总体均值在3类中有显著差异,说明目前的聚类是合理的。

image-20221226164441757

上表展示了3个类的类成员数量。

实时效果反馈

1. 关于K-Means聚类分析,下列说法正确的是_______

A K-Means聚类不常用

B 需要指定聚类数目K

C 执行效率低下

D 以上说法均不正确

2. K-Means聚类分析的菜单选项是___:

A 【分析】----> 【回归】----> 【线性】

B 【分析】----> 【相关】----> 【距离】

C 【分析】----> 【分类】----> 【K-均值聚类】

D 【分析】----> 【相关】----> 【双变量】

答案

1=>B 2=>C

聚类分析_聚类分析原理 生存分析

北京市昌平区回龙观镇南店村综合商业楼2楼226室

©2014-2023 百战卓越(北京)科技有限公司 All Rights Reserved.

京ICP备14032124号-2