python str.extract提取小数+表inner内连接后，行数多于之前-CFANZ编程社区

数据处理中的一些小技巧

写在最前面
原文

str.extract提取小数
python 表inner内连接后，行数多于之前

完善

Python数据处理的小技巧

1. 使用列表解析进行数据转换
2. 使用`collections.Counter`统计元素出现次数
3. 使用`zip`函数同时迭代多个列表
4. 使用`enumerate`获取元素的索引
5. 使用`pandas`进行数据分析
结语

写在最前面

读取某列信息，且仅保留数字。
本文首次发表时间为：2023-01-28 23:18:47

由于质量分过低，因此对本文进行完善更新
主要补充为一些python小技巧的介绍，如列表解析、collections.Counter、zip、enumerate以及pandas库的使用。这些技巧和工具可以加快数据处理的速度，并提高代码的可读性。

str.extract提取小数

注意：
提取小数代码为：

.str.extract('(\d+\.?\d*)', expand=False)

提取整数代码为：

.str.extract('(\d+)', expand=False)

读取某列信息，且仅保留数字

# 读取这一列中的信息，保留数字
def numOnly(col_names):
    for col_name in col_names:
        b[col_name] = b[col_name].str.extract('(\d+)', expand=False)
        
    index_start = b.columns.get_loc("血小板计数")
    index_end = b.columns.get_loc("谷丙转氨酶")
    for column_index in range(index_start,index_end+1):
        b.iloc[:,column_index] = b.iloc[:,column_index].str.extract('(\d+\.?\d*)', expand=False)
        
    index_start = b.columns.get_loc("手术_出血量ml")
    index_end = b.columns.get_loc("详情_Apgar评分(高)")
    for column_index in range(index_start,index_end+1):
        b.iloc[:,column_index] = b.iloc[:,column_index].str.extract('(\d+\.?\d*)', expand=False)
    return True

python 表inner内连接后，行数多于之前

python str.extract提取小数+表inner内连接后，行数多于之前_经验分享

原因：有重复的表连接字段

修改：

c.drop_duplicates(subset=["就诊标识（医渡云计算）"], keep='last',inplace=True)
c.shape

解决：

python str.extract提取小数+表inner内连接后，行数多于之前_经验分享_02

完美！！

完善

Python数据处理的小技巧

Python是一种强大的编程语言，非常适合数据处理和分析任务。
在这篇博客中，我们将分享一些Python数据处理中的小技巧，这些技巧可以帮助更高效地处理数据。

1. 使用列表解析进行数据转换

列表解析是一种精炼的方式来处理列表中的元素，它可以在一行代码中完成许多操作，如映射、筛选和转换。以下是一个示例，将一个列表中的所有元素加倍：

original_list = [1, 2, 3, 4, 5]
doubled_list = [x * 2 for x in original_list]
print(doubled_list)

2. 使用`collections.Counter`统计元素出现次数

collections.Counter是一个强大的工具，用于统计可迭代对象中元素的出现次数。以下是一个示例，统计字符串中字符出现的次数：

from collections import Counter

text = "Hello, World!"
char_count = Counter(text)
print(char_count)

3. 使用`zip`函数同时迭代多个列表

zip函数允许您同时迭代多个列表，这对于处理多个相关的列表非常有用。以下是一个示例，同时迭代两个列表：

names = ["Alice", "Bob", "Charlie"]
scores = [85, 92, 78]

for name, score in zip(names, scores):
    print(f"{name}: {score}")

4. 使用`enumerate`获取元素的索引

enumerate函数允许您获取可迭代对象中元素的索引，这在需要同时访问索引和元素时非常有用。以下是一个示例：

fruits = ["apple", "banana", "cherry"]

for index, fruit in enumerate(fruits):
    print(f"Index {index}: {fruit}")

5. 使用`pandas`进行数据分析

pandas是一个强大的Python库，用于数据处理和分析。它提供了数据结构和函数，可以轻松处理和分析大量数据。以下是一个示例，使用pandas加载和分析CSV文件：

import pandas as pd

data = pd.read_csv('data.csv')
print(data.head())

结语

Python提供了丰富的工具和库，可以帮助您更高效地处理数据。在实际工作中，掌握这些技巧以及其他数据处理技术是非常重要的，可以大大提高生产力和分析能力。

python str.extract提取小数+表inner内连接后，行数多于之前