前面的话:
本文是近期对空间聚类和特征分析研究的总结性文档之一,有对这些算法有兴趣的同学,可以与我联系,另外如果有同学做毕业论文想做相关想法的,我可以以企业导师的身份进行指导,具体的要求,联系我的时候会详述。
——————我是分割线——————
车辆的的轨迹数据是车辆行驶的客观记录,轨迹中虽然仅仅包含了最基础的位置以及时间信息,但是通过这些信息,可以发掘大量有关车辆以及驾驶员的特征,这篇文章就通过一个简单的分析,来简单说明一下通过车辆轨迹数据进行数据挖掘的实例。
长度和方向,所以行驶特征类推出来,无非就是行车的速度和行车的方向,速度这个问题好理解,但是如何来对速度数据进行特征化,这一直是一个问题。分布性描述数据来进行分析挖掘。
行驶的特征进行识别呢?具体数值就变成了一个区间值,所受的影响就降低很多了。聚类分析。
颜色混杂比较严重,这样就说明了他们的速度变化得比较明显(也就是不够均衡),而b2点之间的颜色变化相对比较少,就说明了b2的车速相对比较均衡。量化对比。速度的密度分布情况进行对比。
旅游车辆的特征与出租车不一样,出租车一天大部分时间都在路上运行,而旅游包车大部分时间都在停车。这样看起来,整个分布好像差不多,我们放大一个细节部分看看,比如10-20这个区间。
以后会逐一说明