基于http://c.biancheng.net/pandas/dataframe.html的学习,主要是为了方便自己查找
1引入自定义module
import sys
#被引用模块所在的路径
sys.path.append("D:/Code/PythonCode/project02/recsys_core-master")
#然后再引用模块
import common.common as common #自定义的数据库连接
2reset_index()
数据清洗时,会将带空值的行删除,此时DataFrame或Series类型的数据不再是连续的索引,可以使用reset_index()重置索引。
DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill=‘’)
level控制了具体要还原的那个等级的索引
在获得新的index,原来的index变成数据列,保留下来。
不想保留原来的index,使用参数 drop=True,默认 False。
3df去除索引保存到csv
df.to_csv("result_test_csv\submission.csv", index=False) # index=None去除索引(等同于index=False),index=True保留索引
4 df转string
root = df['用户名'].values.astype(str)[0]
root