一、准备数据
import pandas as pd
data=pd.read_excel("籍贯.xlsx")
二、 使用.str.split('-')方法进行字符串分割。
#首先,创建一个空的DataFrame,命名为df。
df=pd.DataFrame()
#使用data["籍贯"].str.split('-')方法对"籍贯"列进行字符串分割。
data["籍贯"].str.split('-')
三、提取分隔符”-“前的省份数据
#str[0]表示提取列表中的第一个元素,即分割后的第一部分,它代表了省份。
df['省份'] =data["籍贯"].str.split('-').str[0]
四、提取分隔符”-“后的市区数据
#str[1]表示提取列表中的第二个元素,即分割后的第二部分,它代表了市区。
df['市区'] = data["籍贯"].str.split('-').str[1]
#df['地区'] = df['省份'] + '-' + df['市区']