0
点赞
收藏
分享

微信扫一扫

从技术的角度,为什么一定要使用AI人工智能


                     

从技术的角度,为什么一定要使用AI人工智能_数据

人类进步曲线图

 

 在2005年前后,人类进步曲线突然垂直上升,从人类诞生到2005年有个很长的时间跨度,对比整个2005年以前的历史和现在2005年以后人类进步曲线垂直上升的比较,反映出2005年到2010年、2010年到2020年,2020年到2030年,2030年到2050年演进的方式。你处在人类文明空前大爆发的阶段,人工智能5年的时间相当于过去五千年人类进步的时光。

从技术的角度,为什么一定要使用AI人工智能_数据_02

2005年前后人类进步曲线图

 

如图1-4所示,从数据的角度观察数据的核裂变式增长,2005年以前人类历史上总共拥有的数据(书籍、音频、视频等)是130EB,2010年从130EB上升到1200EB,增长了约10倍;到了2015年,从1200EB增长到 7900EB,增长了约7倍;预计到2020年,将到达40900EB,从2015年到2020年增长了5倍。而2020年与从人类诞生到2005年以前的数据比较,增长了约300倍以上。

从技术的角度,为什么一定要使用AI人工智能_人工智能_03

图 1- 4  数据的核裂变式增长

      

如图1-5所示,面对数据的核裂变式增长,我们怎么办?数据收集、存储、管理都有成本,FaceBook、谷歌、Amazon等公司将用户数据收集起来,是否就为了做大数据?一开始的时候他们可能为了做大数据,但数据足够大的时候,为了提升单位数据的价值,必须求助人工智能。这里谈一下大数据,机器学习是大数据的核心之一,大数据也包括SQL、流处理、图计算等,但在真正人工智能的深度学习和增强学习面前,以前了解的机器学习和图计算只是开胃菜。

 

从技术的角度,为什么一定要使用AI人工智能_深度学习_04

图 1- 5数据的核裂变式增长

 

如图1-6所示,面对数据海量式的、核裂变式增长,数据科学家们使用Hive、数据库、或者使用Python、R语言进行处理,从2020年来看,数据科学家们能处理的数据大约是数据总量的10%,如果想依赖数据科学家来处理爆炸式增长的数据是远远不够的。

从技术的角度,为什么一定要使用AI人工智能_深度学习_05

图 1- 6传统的数据处理方式无法适应数据的增长

 

在数据科学家们使用传统的方法(Hive、数据库)解决问题的基础上,图1-7中所示的机器上的方法是使用Hadoop、Spark进行处理,从大数据的视角,Spark是大数据处理的计算引擎;但从人工智能的视角,使用大数据进行的处理依旧不能满足数据爆发式的增长,这里大约处理15%-20%的数据。

 

从技术的角度,为什么一定要使用AI人工智能_人工智能_06

图 1- 7机器处理数据的方法

 

       如图1-8所示,使用机器学习(包括Spark机器学习本身,处理15%-20%的数据)的基础上,进行人工智能处理。AI的处理能力由低到高分别为:机器学习、深度学习、增强学习。这里除了机器学习,还有一个向上的箭头,可以认为下面的三分之一为机器学习算法本身(线性回归、逻辑回归、K-means等),中间的三分之一是深度学习,上面的三分之一是增强学习。此时得出一个结论:人工智能的核心杀伤力是以深度学习为基础的增强学习。真正的人工智能就是深度学习、增强学习。要想体验、驾驭人工智能时代,核心是增强学习方向。

但现在人工智能业界运用最普遍的是机器学习,原因在于:第一点,因为很多企业的数据规模没那么大,也没那么迫切的需求提取数据的价值,第二点,没有足够的人才进行人工智能处理。

从技术的角度,为什么一定要使用AI人工智能_数据_07

图 1- 8人工智能方法

       FaceBook、谷歌、Amazon业界最领先的人工智能公司,他们的所有产品都在全面的深度学习化,一开始是机器学习和大数据公司,在全面的转向深度学习。在2020年以前,人工智能学习的核心是深度学习,深度学习是目前商业界最有价值和潜力的,深度学习应用于自动驾驶和演示人工智能武器等,在2020年以后可以增强学习为核心。

       增强学习的核心是实时的与环境进行交互,交互的能力可从环境交互中不断提升自己的能力,但其致命性的弱点是增强学习的数据不够多,因为是实时的交互。而深度学习最擅长的就是海量的数据处理,增强学习和深度学习的联合体,将使增强学习爆发出终极的潜力,也使深度学习的价值最大化。因此,2020年前要以深度学习为核心。

 


举报

相关推荐

0 条评论