目录
百战程序员,全站22050+开发课程+文档 ,学习精选优质好课快人一步!观看视频 快捷键ALT+N

Python全系列 教程

3567个小节阅读:5929.6k

收藏
全部开发者教程

鸿蒙应用开发

C语言快速入门

JAVA全系列 教程

面向对象的程序设计语言

Python全系列 教程

Python3.x版本,未来主流的版本

人工智能 教程

顺势而为,AI创新未来

大厂算法 教程

算法,程序员自我提升必经之路

C++ 教程

一门通用计算机编程语言

微服务 教程

目前业界流行的框架组合

web前端全系列 教程

通向WEB技术世界的钥匙

大数据全系列 教程

站在云端操控万千数据

AIGC全能工具班

A

A A

White Night

阅读(327)
赞(0)

四、典型相关分析

1、什么是典型相关

变量间的相关关系可以分为以下几种:

  • 两个变量间的线性相关关系,可用简单相关系数
  • 一个变量与多个变量之间的线性相关关系,可用复相关系数。
  • 多个变量与多个变量间的相关关系,使用典型相关关系

典型相关分析研究的是两组变量之间的关系,如{x1, x2, x3}和{y1, y2, y3}两组变量之间的关系。

2、典型相关分析的基本原理

典型相关分析在研究两组变量间的线性相关关系时,将每一组变量作为一个整体进行分析。它采用类似于主成分分析(PCA)的方法,在每一组变量中都选择若干个有代表性的综合指标,这些综合指标是原始变量的线性组合,代表了原始变量的大部分信息,且两组综合指标的相关程度最大。

简单地说,对于{x1, x2, x3}和{y1, y2, y3}两组变量,我们先求出能体现x和y最大相关性的一对变量u1,v1:u1是{x1, x2, x3}的线性组合,v1是{y1, y2, y3}的线性组合。

然后再类似的求第二、第三对典型相关变量,然后我们就得到两组典型相关变量{u1,u2,u3}和{v1,v2,v3}。三对典型相关变量是彼此不相关的,它们反应了变量组x和y之间的相关关系。

当两组变量的数量不一致时,那么可提取到的典型变量个数就等于较少数据组的变量个数,如对于{x1, x2, x3}和{y1, y2},可提取的典型变量为2个。

3、示例分析

示例:研究气象因素与传染病发病之间的相关性,获得某省近年的月平均气压(X1)、月平均气温(X2)、月平均降水量(X3)、月平均风速(X4)与菌痢发病率(Y1)、流感发病率(Y2)和流脑发病率(Y3)。

  1. 导入数据
  2. image-20211008140835910
  3. image-20211008141428013
  4. 点击“确定”,在输出窗口查看结果。
  5. image-20211008142317466

此图反映了各变量间的相关系数,从中可以看出不同变量间的相关程度。 如果组内变量间的相关系数高,说明两者包含的信息有重叠部分;如果组间变量相关系数高,则说明两者有一定相关性

  1. image-20211008141743029

    从典型相关性中可以看到有三个相关系数。分别是0.803、0.330、0.141。那这些相关系数哪个是有意义的,哪个是没有意义的。通过显著性来判断,第一对典型相关变量的显著性是0,p< .001,说明第一对相关系数是有意义的。而第二对显著性大于0.05,说明第二对相关系数没有意义。

  2. image-20211008144035772

    上图可以看到有标准化典型相关系数和非标准化典型相关系数,如果研究变量的单位相同,则看非标准化的典型相关系数,如果单位不同,则看标准化后的典型相关系数。

    我们现在变量的单位是不相同的,所以看标准化典型相关系数。因此来自气象因素的第一典型变量U1= -0.183x1-0.989x2+0.058x3+0.721x4,其中x2和x4的系数绝对值较大,反映气象因素的典型变量主要由气温(x2)决定,其次为风速(x4)。

    同理V1=-0.809y1+0.419y2+0.383y3。反映传染病因素的典型变量主要由y1决定。

  3. image-20211008145042581

    典型载荷系数(结构相关系数:典型变量与原始变量之间的相关系数);

    交叉载荷系数(某一组中的典型变量与另外一组的原始变量之间的相关系数)。

  4. image-20211008145522393

    上图是冗余分析的结果,它说明各典型变量对各变量组方差解释的比例。

相关分析-距离分析 回归分析-回归分析和相关分析的区别和联系

北京市昌平区回龙观镇南店村综合商业楼2楼226室

©2014-2023 百战卓越(北京)科技有限公司 All Rights Reserved.

京ICP备14032124号-2