0

点赞

收藏

分享

【Python数据预处理系列】精通Pandas：数据清洗中的字符串分割技巧（例子：如何将籍贯列中的横线替换为省份和市区）

小飞侠熙熙 2024-06-05 阅读 17

标签: python pandas 数据分析数据预处理分割字符串 str split函数数据清洗

一、准备数据

import pandas as pd
data=pd.read_excel("籍贯.xlsx")

二、使用.str.split('-')方法进行字符串分割。

#首先，创建一个空的DataFrame，命名为df。
df=pd.DataFrame()

#使用data["籍贯"].str.split('-')方法对"籍贯"列进行字符串分割。
data["籍贯"].str.split('-')

三、提取分隔符”-“前的省份数据

#str[0]表示提取列表中的第一个元素，即分割后的第一部分，它代表了省份。
df['省份'] =data["籍贯"].str.split('-').str[0]

四、提取分隔符”-“后的市区数据

#str[1]表示提取列表中的第二个元素，即分割后的第二部分，它代表了市区。
df['市区'] = data["籍贯"].str.split('-').str[1]

#df['地区'] = df['省份'] + '-' + df['市区']

0 条评论

小飞侠熙熙

关注