0
点赞
收藏
分享

微信扫一扫

精通Java数组的艺术:从初学者到高手的进阶之路(二)

zhaoxj0217 2023-06-06 阅读 51

摘要: 半监督学习强调的是一种学习场景, 在该场景下, 无标签数据可以协助带标签数据提升预测质量.

1. 基本概念

  • 监督学习: 训练数据都有标签, 相应的任务为分类、回归等.
  • 无监督学习: 训练数据都没有标签, 相应的任务为聚类、特征提取 (如 PCA) 等.
  • 半监督学习: 部分训练数据没有标签, 相应任务与监督学习一致.

从三者的关系可以看出, 半监督学习是从监督学习与无监督学习自然推导出来的.

2. 学习场景

半监督学习的一大意义在于, 它导出了学习场景这个概念.

  • 上午来了 100 个就诊者, 主治医生啥也没说, 实习生自悟, 把他们分成几个簇, 并且无法解释每簇的语义 (是否患病之类), 这是无监督学习场景中的聚类问题.
  • 上午来了 100 个就诊者, 主治医生对每个人判断, 哪些患流感 (正例), 哪些没有 (负例). 实习生学习到流感的诊断方法. 下午来了新的就诊者, 实习生对他们进行诊断. 这是监督学习场景中的二分类问题.
  • 上午来了 100 个就诊者, 主治医生对其中的 40 个人判断, 哪些患流感 (正例), 哪些没有 (负例). 实习生对剩下的 60 人进行诊断. 这是封闭世界半监督学习场景中的二分类问题.
  • 上午来了 100 个就诊者, 主治医生对其中的 40 个人判断, 哪些患流感 (正例), 哪些没有 (负例). 下午来了新的就诊者, 实习生对他们进行诊断. 这是开放世界半监督学习场景中的二分类问题.

关于半监督学习中无标签数据协助提升学习器质量的讨论, 参见 半监督学习之白话版 (图示).
关于场景的其它论述, 参见 机器学习研究套路: 数据、场景、问题、方法.

举报

相关推荐

0 条评论