参数优化过程中所用数据应该用训练集 (占所有数据的一部分),如果用所有数据会导致模型评估的所有结果都偏高,因为这些评估都涉及测试集,如果用所有数据进行训练,导致测试集预测结果大部分都正确,所以准确率,auc等都偏高