0
点赞
收藏
分享

微信扫一扫

# yyds干货盘点 # 盘点一个AI都无法解决的Python基础题目(中篇)

大家好,我是皮皮。

一、前言

前几天在Python白银交流群【大侠】问了一个Pandas实战的问题,一起来看看吧。上一篇文章说到,看上去AI给的答案,似乎让【大侠】不满意,遂来白银交流群问问大佬们。这一篇文章,我们一起来看看【瑜亮老师】给的代码。

二、实现过程

粉丝的原始数据中,还是有些乱的,比方说存在空格、中文、存在*号、存在漏括号等等,若想进一步的挖掘数据,必须对原始数据进行预处理。

# yyds干货盘点 # 盘点一个AI都无法解决的Python基础题目(中篇)_Python基础

这里【瑜亮老师】给了具体的代码,如下图所示:

# yyds干货盘点 # 盘点一个AI都无法解决的Python基础题目(中篇)_原始数据_02

import re
import pandas as pd

result = []
# 打开原始的txt文件
with open('data.txt', 'r', encoding='utf-8') as f:
    # 逐行读取原始文件
    for line in f:
        if '[' in line and ']' in line:
            result.append(eval(line))
        elif '数据' in line:
            if "备注" not in line:
                line = re.sub(r"[\u4e00-\u9fa5【】!\]]", "", line).strip()
                result.append(eval(line))
        elif "*" not in line:
            line = line.replace("]", "")
            result.append(eval(line))

res = [result[i:i+3] for i in range(0, len(result), 3)]
df = pd.DataFrame(res)
df = df.explode([1, 2], ignore_index=True)
df.columns = ["日期", "股票代码", "data"]
print(df)
df.to_excel("data.xlsx")

代码运行之后,可以得到预期的结果,如下图所示:

# yyds干货盘点 # 盘点一个AI都无法解决的Python基础题目(中篇)_原始数据_03

后来粉丝按照上述思路,顺利地解决了粉丝的问题。事实证明,能让AI都无法解决的代码问题,大都是自己并没有问清楚,论准确表达的重要性。

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Pandas实战的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【大侠】提出的问题,感谢【巭孬🕷】、【瑜亮老师】、【隔壁😼山楂】、【甯同学】给出的思路,感谢【莫生气】、【曾是惊鸿照影来】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

# yyds干货盘点 # 盘点一个AI都无法解决的Python基础题目(中篇)_Python应用_04

举报

相关推荐

0 条评论