Python全系列 教程
3567个小节阅读:5929.7k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
xxxxxxxxxx
171# 清除无用的列
2# 删除item_id 或者 movie_id 其中一个
3all_df.drop(columns=['item_id'],inplace=True)
4all_df
5# 数据的清洗-缺失值、异常值、重复值
6# 缺失值
7all_df.info()
8# 删掉没有值的列, axis=1表示列 0表示行(默认),how='all'表示全部为空
9all_df.dropna(axis=1,how='all',inplace=True)
10# 异常值
11all_df.describe()
12# 重复值
13all_df.duplicated(subset=['user_id','movie_id']).any()
14# 数据的探索
15# 统计对电影评分的男性与女性的人数
16# all_df['gender'].value_counts()
17all_df['gender'].value_counts().plot(kind='pie',autopct='%.2f%%')