1. 数据收集与预处理的任务?
2. 数据收集与预处理的分步骤?
3. 数据可视化工作?
4. 数据清洗工作的任务?
5. 特征工程
6. 构建特征集和数据集
X=df.drop('浏览量',axis=1)
Y=df['浏览量']
print(X.head())
print(Y.head())
7. 拆分训练集、验证集和测试集
from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test = train_test_split(X,Y,test_size=0.2,random_state=0)