第1关:字符串操作方法
任务:读取step1/bournemouth_venues.csv文件,获取Venue Name列,通过向量化字符串操作得到清洗后的数据。
import pandas as pd
def demo():
#********** Begin **********#
data=pd.read_csv('./step1/bournemouth_venues.csv')
data=data['Venue Name']
data=data.str.split().str.get(-1)
data=data.str.replace("P.*","")
data.drop(data[data.values==""].index,inplace = True)
data1=data.str.contains("[a-zA-Z]+")
data.drop(data1[data1==False].index,inplace=True)
return data
# ********** End **********#
第2关:Pandas的日期与时间工具
任务:根据预期输出,创建三种不同索引的数据结构。
import pandas as pd
date_number = input()
# ********** Begin ********** #
print(pd.date_range(date_number, periods=10))
print(pd.period_range(date_number, periods=10))
print(pd.timedelta_range('1 hours', periods=10, freq='H'))
# ********** End ********** #
第3关:Pandas时间序列的高级应用
根据相关知识完成下列任务:
- 求上个季度(仅含工作日)的平均值;
- 求每个月末(仅含工作日)的收盘价;
- 迁移数据365天;
- 求一年期移动标准差。