自然图像训练示例是根据真实数据创建的。它们的创建包括以下步骤:
- 收集图形数据(拍摄感兴趣的对象、从相机捕获视频流、突出显示网页上的图像的一部分)
- 过滤 - 检查图像是否满足要求:其上的物体有足够的照明水平,是否存在所需的物体等
- 准备标记工具(编写自己的亦或优化完成)
- 标记(选择四边形、所需的标志物、图像中感兴趣的区域)
- 为每个图像分配一个标签(图像中对象的字母或名称)
创建训练数据的另一种方法是人工生成。可以采用多个模板/“理想”示例(例如字体集)并使用各种变形来创建所需数量的示例进行训练,如以下几种:
- 几何(仿射,投影,...)
- 亮度/颜色
- 背景替换
- 特定于正在解决的问题的失真:眩光、噪声、模糊等