Python全系列 教程
3567个小节阅读:5931.8k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
xxxxxxxxxx
# 值为一个标量
df['new_col1'] = 1
df.newvar = 1 #注意该命令不会报错!但并没有添加新变量
# 值为一个列表,那么列表的长度必须和行数一致
df['new_col2']= range(0,52)
# 值为一个Series,那么Series的长度可以不与行数一致,但是超出行数值会被设置为NaN
df['new_col3'] = pd.Series([1,2,3,4,5,6])
# 值为一个表达式,是原用的列上的值进行计算
df['new_col4'] = df['身高'] + 1
# 值为map处理的值,是原用的列上的值进行计算
df['new_gender'] = df['性别'].map({'男':1,'女':0})
# 值为一个函数
import math
df['new_col5'] = math.sqrt(9)
df['new_col5'] = math.sqrt(df.体重) #报错
xxxxxxxxxx
df.apply(func,axis)
func : 希望对行/列执行的函数表达式
axis = 0 :针对行还是列逬行计算
xxxxxxxxxx
def get_value(data):
return data['体重']
df['a'] = df.apply(get_value, axis=1)
df.head()
另一种写法
df ['列名'] = df. oldvar. apply(函数表达式)
xxxxxxxxxx
df['n5'] = df.体重.apply(math.sqrt)
df['n7'] = df.体重.apply(numpy.sqrt)
xxxxxxxxxx
# 使用自定义函数
def get_first(tmp):
return tmp[:1]
df['n6'] = df.开设.apply(get_first)
xxxxxxxxxx
df.insert(loc,column,value,allow_duplicates)
xxxxxxxxxx
# 指定位置增加新列
df.insert(1,'new_col',100)
df.insert(1,'new_col2',df.课程.apply(get_first))
xxxxxxxxxx
df.assign(varname = expression)
xxxxxxxxxx
# 返回新的dataframe
df2 = df.assign(n8 = df.课程.apply(get_first))
实时学习反馈
1. Pandas中在指定位置插入新变量列的方法是_____:
A insert()
B index()
2. Pandas中基于一个原变量做函数运算,下划线处需要填写的代码是_____:
xxxxxxxxxx
df = pd.read_excel('stu_data.xlsx')
# 使用自定义函数
def get_first(tmp):
return tmp[:1]
df['n6'] = df.开设.___________
A apply(get_first())
B apply(get_first)
答案
1=>A 2=>B