0
点赞
收藏
分享

微信扫一扫

将pandas某列中的字符串按空格或换行符拆分成列表,然后剔除列表中的中文字符串

要删除 Pandas DataFrame 中某一列中的汉字字符,然后将该列的字符串按空格或换行符拆分成列表,可以按照以下步骤进行:

假设你有一个名为 df 的 DataFrame,要操作的列名为 '某列'

import pandas as pd

# 创建示例 DataFrame
data = {'某列': ['Hello 你好', 'This is a test', 'Python 编程', '拆分\n字符串']}
df = pd.DataFrame(data)

# 删除某列中的汉字字符
df['某列'] = df['某列'].str.replace('[\u4e00-\u9fa5]', '', regex=True)

# 将某列的字符串按空格或换行符拆分成列表
df['某列'] = df['某列'].str.split('[\s\n]+')

# 打印处理后的 DataFrame
print(df)

上述代码中,我们首先使用 str.replace 方法和正则表达式 [\u4e00-\u9fa5] 将列 '某列' 中的汉字字符替换为空字符串,实现了删除汉字字符的操作。然后,使用 str.split('[\s\n]+') 方法将列 '某列' 中的字符串按照空格或换行符进行拆分,得到一个包含列表的 Series。

请根据你的实际数据框和列名替换示例中的 df'某列'。这将帮助你删除汉字字符并将字符串拆分成列表。


要将 Pandas DataFrame 中某一列中的字符串按空格或换行符拆分成列表,并在列表中剔除中文字符串,你可以按照以下步骤进行操作:

假设你有一个名为 df 的 DataFrame,要操作的列名为 '某列'

import pandas as pd

# 创建示例 DataFrame
data = {'某列': ['Hello 你好 123', 'This is a test', 'Python 编程', '拆分\n字符串']}
df = pd.DataFrame(data)

# 将某列的字符串按空格或换行符拆分成列表
df['某列'] = df['某列'].str.split('[\s\n]+')

# 剔除列表中的中文字符串
df['某列'] = df['某列'].apply(lambda x: [item for item in x if not any(char >= u'\u4e00' and char <= u'\u9fff' for char in item)])

# 打印处理后的 DataFrame
print(df)

上述代码中,我们首先使用 str.split('[\s\n]+') 方法将列 '某列' 中的字符串按照空格或换行符进行拆分,得到一个包含列表的 Series。然后,我们使用 apply 方法和一个 lambda 函数来遍历每个列表,并使用列表推导式剔除了包含中文字符的元素。

请根据你的实际数据框和列名替换示例中的 df'某列'。这将帮助你将字符串按空格或换行符拆分成列表,并剔除列表中的中文字符串。

举报

相关推荐

0 条评论