Python全系列 教程
3567个小节阅读:5929.2k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
分类变量:做频数分析
点击【确定】查看统计结果
可以看到频率表有组别的和性别的。在组别中有试验组和对照组。性别有男和女。
一次获取所有变量的频率
注意:对所有变量的测量值必须要正确。
连续变量:获取最大值、最小值、均值和标准差可以根据描述统计
点击【确定】查看统计结果
在描述统计中可以看到最大值、最小值、均值和标准差,还可以看到是否有缺失值。可以发现有效个案数和年龄、激素水平都是68,没有缺失值。
查看均值与最大值和最小值之间的差距。发现年龄的均值50.1与最大值80和最小值17,数据不是很偏。而激素水平均值是0.55与最大值10.1和最小值0.05,数据是很偏的。
也可以根据查看均值和标准差。如果标准偏差超过了均值的二分之一,说明数据多半是偏态的。同样发现激素水平数据是偏态的。
通过图形查看
绘制激素水平的直方图
可以看到激素水平确实是偏态的。大多数值低于4.0。4.0~10之间到底有没有值。可以查看数据,对数据进行排序
右键jisu列,选择【降序排序】
可以发现激素数据最大值为10.10,次大数3.2。有一个远远偏离数据的极大值。这个极大值能不能删掉?假如说这个数据不是实验室测量错误,真的是很大。它所代表的个体是真的来自于我们的研究总体,就是它的数值确实是真实有效的。如果这个数据确实是有代表性的,这肯定是不能删除的。因为它就代表了整个群体中的一部分情况,如果把它删掉了,总体代表性就出现了问题。我们通过专业知识,专业方法认为这个指标这个个体它不能代表我们的总体,那么就可以把它删掉。