0
点赞
收藏
分享

微信扫一扫

多特征建模时,特征之间的相关性,和饱和

承蒙不弃 2022-03-27 阅读 56

1、尽管大量图像特征与森林属性具有相当好的相关性,但图像特征之间的高度相关性使得它们在估计中的使用变得复杂。添加一些具有高互相关性的图像特征并不能改善估计的结果,因为附加的特征包含很少或没有进一步的信息。尽管在某些估计任务中使用大量光谱特征可能是有益的,但通常情况并非如此。如果每个特征的性能都不是先验的,那么它们就不能以最佳方式加权,并且估计误差实际上可能会随着使用的特征数量的增加而增加。使用可以为特征生成最佳权重和/或能够为实际分析选择性能最佳子集的技术,可以避免这个问题。我们选择了后一种替代方案并进行了分析,哪些特征对估计精度有很大贡献,以及稳健估计结果所需的适当特征数量是多少。

特征选择是**作为顺序前向选择进行的。**在该过程的第一阶段,选择了给出最低 RMSE 的特征。后来该过程被迭代,并且在每次迭代期间,具有已选择特征的最佳 RMSE 的特征被添加到所选特征集中。使用变量检查所选特征对估计精度的影响:DBH、高度、基底面积和体积。

添加更多图像特征明显提高了估计的准确性,直到所选特征的数量达到大约 10 个,之后在估计过程中添加更多特征几乎没有提高估计精度。将图像特征的数量从 10 个增加到 20 个并没有带来显着的改进,之后几乎没有任何改进。通常,基于灰度共生矩阵的图像特征在所选特征中被广泛表示。由于这些通常彼此高度相关,当添加更多特征时,估计精度自然会很快达到饱和点。具有不同图像特征集的森林估计的 RMSE 值显示在表 5。

表 5。使用不同图像特征组合的 k-nn 方法估计的森林属性的均方根误差(RMSE) 和相对 RMSE (%)
在这里插入图片描述

举报

相关推荐

基于标签相关性的多标签学习

相关性分析

0 条评论