2018年12月23日看到了一片文章,标题是《人工智能一定需要大数据吗?未必!》,原文链接:https://mp.weixin.qq.com/s/DkMNX6NHsuCeO_i-20lUMA。真的未必么,这中间是不是还有什么没有说清楚的东西呢?文中的观点基本上就是标题的说法。但是,未必与否,这里是需要辨证地看的。
为什么这么说呢?
因为,任何数据积累到一定程度,都会变成一个结果:数据量巨大。嗯,很多年前IT业内曾经批评我十六年前的老公司没有大数据,有的只是数据量巨大,具体是哪家公司我就不多说了。
大数据到底是什么,这里不想多说,写过的人太多,青润这里只能说一句话:数据量大到一定程度的,并且经过格式化规范化处理后可以用于分析、挖掘和各种计算使用的数据就是大数据。
那,结果呢,人工智能积累的数据需要几个方面,我们用其中目前接触相对较多的识别技术来讲述一下会比较合适,了解青润的人都知道,青润再2005年第二次进入中科院做的就是人脸识别和行为分析方面的研究和产品。
识别,就需要考虑到下面几点:
1、样本数据的采集;
2、样本数据的标定;
3、样本数据的自我检验;
4、基于样本数据的模型构建;
5、构建样本的特征码库;
识别过程是这样的:
6、进行目标数据采集;
7、基于模型构建获取的特征提取算法进行特征提取;
8、进行目标特征码和样本特征码的对比,并根据对比的异或数据得到结果;
于是基本的过程结束了,下面是增值和演进过程:
9、采集新的数据,并进行同样模型的特征提取,然后进行特征对比,获得识别结果。
10、 随着时间的演变,每一个被检验目标都会发生变化,人会从小孩变成成人然后变成老人,各种材料会衰变老化(比如一些重要设备的重要部件在发生重大事故时要检测是不是原来的部件,是不是因为老化造成的,是不是被人为破损或者替换了的时候都需要这个),这时候,就产生了一种模型的演进算法,也可以称之为疲劳算法。
后续内容请查看:https://mp.weixin.qq.com/s/pxIAanZFUIaNXQHSCChIdw
本文是青润在公众号上得到第一个陌生人赞赏的文章,告诉你什么才是人工智能,什么才是大数据,什么样的模型构建过程才是合理的,不是虚假的,不要被opencv上的抄袭给骗了。