0
点赞
收藏
分享

微信扫一扫

利用机器学习识别细碎图斑实战(1):前言


 在做自然资源类项目的时候,因为各种原因,会产生大量的细碎图斑,这些图斑可能是外业采集的时候本身就是细碎的,也有可能是因为各种后期处理生成的(比如用村界去切割地类图斑的时候,也会生成大量的细碎图斑)如下所示:

利用机器学习识别细碎图斑实战(1):前言_机器学习

图1:碎片图斑

 

当然还有的本身不是细碎图斑,但是因为形状非常怪异,导致制图的时候非常难以处理,也会需要作为细碎图斑识别处理加以处理,比如下面这几个图斑:

利用机器学习识别细碎图斑实战(1):前言_机器学习_02

图二:碎片及带有小尖角的不规则图斑

 

利用机器学习识别细碎图斑实战(1):前言_搜索_03

图三:狭长的不规则图斑

 

利用机器学习识别细碎图斑实战(1):前言_数据_04

图四:构造形状不规则图斑

(这种图斑,多半是由于多个地块融合的产生的,形状非常诡异)

 

这些图斑,都被认为是细碎图斑,需要从数据中识别出来,说到这里,做自然资源类项目的同学肯定已经深恶痛绝了……这个根本就是无解的难题啊。

 

所以有时候虾神去见客户粑粑的时候:

 

利用机器学习识别细碎图斑实战(1):前言_数据_05

遇上这种情况,每次我的心里都是:

 

利用机器学习识别细碎图斑实战(1):前言_搜索_06

所谓的人工智能,目前主流的就是:

干活的时候,全是人工

写PPT的时候,就是智能了

 

讲道理,如果仅仅是细碎的碎片要处理,简单一句话,面积小于xx平方米的,统统一刀切……但是图三图四图五怎么办呢?当然,国土里面,还有一些指标,比如地块规则度的测量,比如形状率,圆形率,椭圆率指数,放射度指数、紧凑度指数等等,来识别这些图斑,但是每个地方都有每个地方不同的特点,任何情况下,都不可能做到用一个数值进行一刀切,这种情况怎么办呢?

 

利用机器学习识别细碎图斑实战(1):前言_数据_07

如果没有固定的阈值指标,而只能“凭感觉”处理,那么有没有一种方法,能够尽量的减轻人工劳动呢?答案就是采用机器学习

 

虽然说,我们不能给出所有的细碎图斑的指标值,但是总体说来,作为细碎图斑,还是一定的特征可以识别的,比如面积比较小,或者形状很不规范,又比如正好在若干大斑块的中间等等,但是这些特征如果要用数值来进行表达,可能非常的复杂,单单是“形状怪异”这个一个形容词,可能就需要几十个甚至上百个特征变量来描述,我们需要人工总结出这些复杂的特征,并且转换成if……else……编码来实现,几乎是一个不可能完成的任务。

 

而复杂性这个怪兽,我们也并非无可奈何,机器学习就是我们对付复杂性问题的一个卓有成效的武器。

 

我们仅需要把数据扔进去,就可以让系统自动的去构建需要识别的特征模型——这就是机器学习的神奇之处。

 

那么既然叫做机器学习,很核心的一点,就是“学习”二字,那么用人类可以解释的语言来说,一个学习的过程,需要有老师、教材、传授、接收、掌握……等一系列过程,机器学习也是一样。

 

具体机器学习的各种概念,大家可以到网上去找相关资料,绝对的汗牛充栋,我这里就不献丑了。 

最后,给出一个题外话,下文有福利哦:

 

前段时间,有篇文章刷屏了,说的国内某度和国外的某歌的区别,比如在某度上搜索如下关键字:

 

利用机器学习识别细碎图斑实战(1):前言_搜索_08

然后同样的关键字在某歌上进行搜索:

 

利用机器学习识别细碎图斑实战(1):前言_搜索_09

结论是大家一致声讨某度的(福)(利)(啊),那么为什么white度,在很多时候,都变成了yellow度呢?从技术角度来说,真心不是某度的锅。

(上面文章原文链接:https://zhuanlan.zhihu.com/p/41800888,当然,现在上某度,已经无法搜到这些信(福)息(利)了)

 

那么到底是什么原因呢,如下所示:

 

利用机器学习识别细碎图斑实战(1):前言_数据_10

以上漫画纯属虚构,某度的搜索机制和算法要比这个高端大气上档次个百八十倍的,虾神这里只是纯粹根据原理进行胡说而已,大家切勿当真

 

上面的小案例中,机器会根据输入的信息,不断的调整系统内部的模型,以做出最优解,这个过程并不需要程序员进行人工干预,这就是机器学习的主要特点之一。相当于对系统进行搜索和确认的用户,就是老师,而机器就是学生,当然,这里大批量的“老司机”把模型给带沟里面去了,这个问题现在有,将来依然会不断的出现。

 

利用机器学习识别细碎图斑实战(1):前言_机器学习_11

 

从下一篇开始,我们讲开始进入机器学习实战的阶段,第二篇主要讲技术路线,待续未完。

举报

相关推荐

0 条评论