Python全系列 教程
3567个小节阅读:5931.4k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
数据集为美国各州机场的航班信息,包含出发地,目的地,是否出发延迟15分钟,是否到达延迟15分钟等。
xxxxxxxxxx
81import numpy as np
2import pandas as pd
3import matplotlib.pyplot as plt
4#支持中文显示
5plt.rcParams['font.family']='Kaiti'
6# 使用非unicode的负号,当使用中文时候要设置
7plt.rcParams['axes.unicode_minus']=False
8data = pd.read_csv('airport-ontime.csv')
字段名称 | 备注 |
---|---|
FL_DATE | 起飞时间 |
UNIQUE_CARRIER | 航空公司 |
ORIGIN_AIRPORT_ID | 起飞机场ID |
ORIGIN_AIRPORT_SEQ_ID | 起飞机场序列号ID |
ORIGIN_CITY_MARKET_ID | 起飞城市ID |
ORIGIN_STATE_ABR | 起飞地州的简称 |
DEST_AIRPORT_ID | 到达机场ID |
DEST_AIRPORT_SEQ_ID | 到达机场序列号ID |
DEST_CITY_MARKET_ID | 到达城市ID |
DEST_STATE_ABR | 目的地州简称 |
DEP_DELAY_NEW | 起飞延迟时长 |
DEP_DEL15 | 起飞是否延迟 |
ARR_DELAY_NEW | 到达延迟时长 |
ARR_DEL15 | 到达是否延迟 |
DISTANCE | 距离 |
DISTANCE_GROUP | 距离分组 |
xxxxxxxxxx
11data.info()
以看到总共502617行、17列。其中DEP_DEL15(起飞是否延迟)非空值是492974行,ARR_DEL15(到达是否延迟)非空值是490716行,Unnamed这列全部为空值。
【示例】缺值处理
xxxxxxxxxx
31#删除Unnamed列
2data.dropna(axis=1,how='all',inplace=True)
3data.info()
【示例】重复值查看
xxxxxxxxxx
41# 重复值查看
2data.duplicated().any()
3data.drop_duplicates(inplace=True)
4data.info()