pandas
字符
看过来
《pandas 教程》 持续更新中,可作为 pandas 入门进阶课程、pandas 中文手册、用法大全,配有案例讲解和速查手册。提供建议、纠错、催更等加作者微信: gairuo123(备注:pandas教程)和关注公众号「盖若」ID: gairuo。查看更新日志。作者开办 Python 数据分析训练营正在报名中,详情 Python 数据分析训练营。
![]() |
本教程作者所著新书《Python之光:Python编程入门与实战》(ISBN:9787111729891)已由机械工业出版社出版上市,各大电商平台有售,欢迎:查看详情并关注购买。 |
![]() |
本教程作者所著新书《深入浅出Pandas:利用Python进行数据处理与分析》(ISBN:9787111685456)已由机械工业出版社出版上市,各大电商平台有售,欢迎:查看详情并关注购买。 |
Series 和 Index 都用一些字符串处理方法,可以方便地进行操作,这些方法会自动排除丢失值和 NA 值。我们可以通过 str 属性访问它的方法,进行操作。
我们可以使用 .str.<method>
访问器(Accessors)来对内容进行字符操作:
s = pd.Series(['A', 'B', 'C', 'Aaba',
'Baca', np.nan, 'CABA',
'dog', 'cat'],
dtype="string")
# 转为小写
s.str.lower()
'''
0 a
1 b
2 c
3 aaba
4 baca
5 <NA>
6 caba
7 dog
8 cat
dtype: string
'''
对于非字符类型我们可以先进行转换,再使用:
# 转为 object
df.Q1.astype(str).str
# 转为 StringDtype
df.team.astype("string").str
df.Q1.astype(str).astype("string").str
大多数操作也适用于df.index
索引类型。
对索引的操作:
# 对索引进行操作
df.index.str.lower()
# 对表头,列名进行操作
df.columns.str.lower()
如果对数据连续进行字符操作,则每个操作都要使用 .str
方法:
df.columns.str.strip().str.lower().str.replace(' ', '_')
对于返回布尔值的操作可以用到 df.loc[]
操作里,进行逻辑筛选。
无「盖若」授权,请勿以任何形式转载,公众号:gairuo
Copyright © 2019 - 2023
Gairuo.com All Rights Reserved v7.6.1.0919
京公网安备11010502033395号
京ICP备15019454号-4