参考:
https://zhuanlan.zhihu.com/p/368073953
https://blog.csdn.net/u014028070/article/details/75171108
训练集效果好,但是测试集预测效果差,为什么?除了模型过拟合训练集的可能,还有可能是训练集和测试集分布不一致。
KDE (核密度估计)分布图可以用于对比训练集和测试集的分布,在matlab中利用其自带的核密度估计函数([f,xi] = ksdensity(x))可以实现。
%by dynamic
%see also http://www.matlabsky.com
%contact me matlabsky@gmail.com
%给一个随机样本
x=[randn(30,1); 5+randn(30,1)];
%计算出各点的概率密度
[f,xi]=ksdensity(x);
%绘制图形
subplot(211)
plot(x)
title('样本数据(Sample Data)')
subplot(212)
plot(xi,f)
title('概率密度分布(PDF)')