Python全系列 教程
3567个小节阅读:5931.1k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
聚类分析是一种建立分类的统计分析方法,它能够将一批观测数据根据其诸多特征,按照在性质上的亲疏程度在没有先验知识的情况下进行自动分类,产生多个分类结果。类内部个体特征具有相似性,不同类间个体特征的差异性较大。
聚类分析以距离作为测度个体“亲疏程度”的指标。为测度个体间的距离,应先将每个观测数据看成p维(p个聚类变量)空间上的一个点。点与点之间的距离越小,意味着它们越“亲密”,越有可能聚成一类;反之,越有可能分别属于不同的类。
常用的个体间距离计算方式
式中,x~i~为个体x的第i个变量的变量值;y~i~为个体y的第i个变量的变量值。
式中,x~i~为个体x的第i个变量的变量值;y~i~为个体y的第i个变量的变量值。
1. 关于聚类分析,下列说法正确的是_______
A 类内部个体特征差异性较大,不同类间个体特征具有相似性
B 是一种回归分析方法
C 按照在性质上的亲疏程度在没有先验知识的情况下进行自动分类
D 聚类分析以数据大小作为测度个体“亲疏程度”的指标
2. 聚类分析的注意点,不正确的是___:
A 所选择的变量应迎合聚类的分析目标
B 各变量的变量值不应有数量级上的差异
C 各变量间不应有较强的线性相关关系
D 随意选取变量
1=>C 2=>D