一、深度学习

1.1 人工智能

1.2 人工智能，机器学习和深度学习的关系

机器学习是实现人工智能的一种途径，深度学习是机器学习的一个子集，也就是说深度学习是实现机器学习的一种方法。与机器学习算法的主要区别如下图所示[参考：黑马]:

深度学习模仿人类大脑的运行方式，从经验中学习获取知识。这也是深度学习被看做黑盒子，可解释性差的原因。随着计算机软硬件的飞速发展，现阶段通过深度学习来模拟人脑来解释数据，包括图像，文本，音频等内容。目前深度学习的主要应用领域有: 语音识别，计算机视觉，自动驾驶

1.3 深度学习发展

二、计算机视觉

计算机视觉是指用摄像机和电脑及其他相关设备，对生物视觉的一种模拟。"它的主要任务让计算机理解图片或者视频中的内容，就像人类和许多其他生物每天所做的那样。

我们可以将其任务目标拆分为:

OpenCV阶段，主要学习图像处理，而图像处理主要目的是对图像的处理，比如平滑，缩放等，想、从而为其他任务 (比如“计算机视觉”) 做好前期工作。

2.1 任务

根据上述对计算机视觉目标任务的分解，可将其分为三大经典任务: 图像分类、目标检测、图像分割。

图像分类 (Classification): 即是将图像结构化为某一类别的信息，用事先确定好的类别(category)来描述图片。

目标检测 Detection):分类任务关心整体，给出的是整张图片的内容描述，而检测则关注特定的物体目标，要求同时获得这一目标的类别信息和位置信息 (classification+ocalization)

图像分割 (Segmentation): 分割是对图像的像素级描述，它赋予每个像素类别 (实例)意义，适用于理解要求较高的场景，如无人驾驶中对道路和非道路的分割。

2.2 计算机视觉的发展

1963年，Larry Roberts发表了CV领域的第一篇专业论文，用以对简单几何体进行边缘提取和三维重建。

1966年，麻省理工学院(MIT)发起了一个夏季项目，目标是搭建一个机器视觉系统，完成模式识别(pattern recognition)等工作。虽然未成功，但是计算机视觉作为一个科学领域的正式诞生的标志。

1982年，学者David Marr发表的著作《Vision》从严谨又长远的角度给出了CV的发展方向和-些基本算法，其中不乏现在为人熟知的"图层”的概念、边缘提取、三维重建等，标志着计算机视觉成为了一门独立学科。

1999年David Lowe提出了尺度不变特征变换 (SIFT,Scaleinvariant feature transform) 目标检测算法，用于匹配不同拍摄方向、纵深、光线等图片中的相同元素。

2009年，由Felzenszwalb教授在提出基于HOG的deformable parts model，可变形零件模型开发，它是深度学习之前最好的最成功的object detection & recognition算法。

Everingham等人在2006年至2012年间搭建了一个大型图片数据库，供机器识别和训练，称为PASCAL Visual object Challenge，该数据库中有20种类别的图片，每种图片数量在一千至-万张不等。
2009年，李飞飞教授等在CVPR2009上发表了一篇名为《ImageNet:ALarge-ScaleHierarchicallmage Database》的论文，发布了lmageNet数据集，这是为了检测计算机视觉能否识别自然万物，回归机器学习，克服过拟合问题。

2012年，Alex Krizhevsky、llya Sutskever 和 Geoffrey Hinton 创造了一个“大型的深度卷积神经网络”，也即现在众所周知的AlexNet，赢得了当年的ILSVRC。这是史上第一次有模型在lmageNet 数据集表现如此出色。自那时起，CNN才成了家喻户晓的名字。