0
点赞
收藏
分享

微信扫一扫

KDE (核密度估计)分布图—用于数据集不一致性评估

参考:
https://zhuanlan.zhihu.com/p/368073953
https://blog.csdn.net/u014028070/article/details/75171108

训练集效果好,但是测试集预测效果差,为什么?除了模型过拟合训练集的可能,还有可能是训练集和测试集分布不一致。

KDE (核密度估计)分布图可以用于对比训练集和测试集的分布,在matlab中利用其自带的核密度估计函数([f,xi] = ksdensity(x))可以实现。

%by dynamic
%see also http://www.matlabsky.com
%contact me matlabsky@gmail.com

%给一个随机样本
x=[randn(30,1); 5+randn(30,1)];

%计算出各点的概率密度
[f,xi]=ksdensity(x);

%绘制图形
subplot(211)
plot(x)
title('样本数据(Sample Data)')

subplot(212)
plot(xi,f)
title('概率密度分布(PDF)')
举报

相关推荐

0 条评论