目录
百战程序员,全站22050+开发课程+文档 ,学习精选优质好课快人一步!观看视频 快捷键ALT+N

Python全系列 教程

3567个小节阅读:5930.8k

收藏
全部开发者教程

鸿蒙应用开发

C语言快速入门

JAVA全系列 教程

面向对象的程序设计语言

Python全系列 教程

Python3.x版本,未来主流的版本

人工智能 教程

顺势而为,AI创新未来

大厂算法 教程

算法,程序员自我提升必经之路

C++ 教程

一门通用计算机编程语言

微服务 教程

目前业界流行的框架组合

web前端全系列 教程

通向WEB技术世界的钥匙

大数据全系列 教程

站在云端操控万千数据

AIGC全能工具班

A

A A

White Night

阅读(801)
赞(0)

相关系数的计算原理

image-20220508152753335

常用术语(针对两连续变量的相关)

  • 直线相关:两变量呈线性共同增大,或者呈线性一增一减的情况
  • 曲线相关:两变量存在相关趋势,但是为各种可能的曲线趋势
  • 正相关与负相关:如果A变量增加时B变量也增加,则为正相关,如果A变量增加时B变量减小,则为负相关
  • 完全相关:完全正相关;完全负相关
  • 零相关:自变量的变化,不会影响因变量的变化

Pearson相关系数

  • 计算公式
ρ(X,Y)=cov(X,Y)σXσY=E(XY)E(X)E(Y)σXσY

公式理解:标准差代表变量的离散程度(信息量大小);

协方差Cov(X,Y)代表各变量共同携带的信息量大小;

相关系数代表两个变量总信息量中的共同部分占比

  • 相关系数ρ的取值范围:-1 < ρ < 1

    • 其正负反映了相关的方向
    • |ρ|越接近于1,说明相关性越好
    • |ρ|越接近于0,说明相关性越差
  • Pearson相关系数的检验:

    • H~0~:两变量间无直线相关关系,ρ=0

    • 检验方法:t检验

      t=r0sr,df=n2
  • Pearson相关系数的适用条件:

    • 必须是线性相关的情形(可以先绘制散点图观察一下)
    • 针对两连续变量的相关系数
    • 极端值对相关系数的计算影响极大,因此要慎重考虑和使用
    • 要求相应的变量呈双变量正态分布(近似也可以)

    image-20220508161406513

Spearman秩相关系数

  • 不服从正态分布的变量、分类或等级变量之间的关联性可采用Spearman秩相关系数
  • Spearman提出首先对数据做秩变换,然后再计算两组秩间的直线相关系数(秩变换分析思想)

实时效果反馈

1. 关于Pearson相关系数,下列说法正确的是:

A 针对两离散变量的相关系数

B 取值范围:0 < ρ < 1

C 针对线性相关的情形

D 以上说法均不正确

2. 关于Spearman相关系数,下列说法正确的是:

A 针对服从正态分布的变量

B 使用了秩变换分析思想

C 分类变量不可使用Spearman相关系数

D 以上说法均不正确

答案

1=>C 2=>B

 

北京市昌平区回龙观镇南店村综合商业楼2楼226室

©2014-2023 百战卓越(北京)科技有限公司 All Rights Reserved.

京ICP备14032124号-2