0
点赞
收藏
分享

微信扫一扫

【Python数据预处理系列】精通Pandas:数据清洗中的字符串分割技巧(例子:如何将籍贯列中的横线替换为省份和市区)

一、准备数据

import pandas as pd
data=pd.read_excel("籍贯.xlsx")

二、 使用.str.split('-')方法进行字符串分割。

#首先,创建一个空的DataFrame,命名为df。
df=pd.DataFrame()

#使用data["籍贯"].str.split('-')方法对"籍贯"列进行字符串分割。
data["籍贯"].str.split('-')

三、提取分隔符”-“前的省份数据

#str[0]表示提取列表中的第一个元素,即分割后的第一部分,它代表了省份。
df['省份'] =data["籍贯"].str.split('-').str[0]

 四、提取分隔符”-“后的市区数据

#str[1]表示提取列表中的第二个元素,即分割后的第二部分,它代表了市区。
df['市区'] = data["籍贯"].str.split('-').str[1]

#df['地区'] = df['省份'] + '-' + df['市区']

举报

相关推荐

0 条评论