出租车GPS轨迹数据挖掘研究.doc

出租车GPS轨迹数据挖掘研究.doc

ID:61765943

大小:29.50 KB

页数:5页

时间:2021-03-19

出租车GPS轨迹数据挖掘研究.doc_第1页
出租车GPS轨迹数据挖掘研究.doc_第2页
出租车GPS轨迹数据挖掘研究.doc_第3页
出租车GPS轨迹数据挖掘研究.doc_第4页
出租车GPS轨迹数据挖掘研究.doc_第5页
资源描述:

《出租车GPS轨迹数据挖掘研究.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、出租车GPS轨迹数据挖掘研究1出租车GPS轨迹数据挖掘技术分析1.1数据预处理。初步的数据采集,往往都是不完整的或不一致的,数据当中可能存在缺漏项或重复项,所以不能直接用于数据分析与数据挖掘,需要进一步进行数据的清理与冗余数据化简操作。出租车的GPS轨迹数据当中,可能存在的问题主要包括两点,其一是轨迹点的经纬度坐标越界;其二时轨迹点位置异常。对这两种数据问题进行清理,可通过以下步骤:首先,处理经纬度坐标越界问题,假设数据采集对象为沈阳市辖区,则要划分重点研究区域,若此次研究主要为主城区的交通道路规划提供参考,则要将绕城高速以外的所有坐标记录进行清除处理。其

2、次,处理轨迹点异常的问题,需要进行异常值过滤处理,如,数据的来源出租车的行车速度要控制在合理范围内;同时,还要有效剔除车载GPS的测量异常值,具体办法可结合中位数滤波器进行有效处理。在数据采集过程中,受到交通拥堵、停靠等现实状况的影响,地位系统当中会出现大量的定位冗余点,若要保证数据分析的准确性,必须对其进行简化处理。针对这一处理过程,可充分利用计算机图形学与制图学领域的研究成果,采用Douglas-Peucker即DP算法,针对出租车GPS轨迹数据中曲线节点密度较高的数据类型,能够起到显著的去冗余效果。1.2地图匹配。在实际数据采集过程中,受到GPS定位

3、精度问题的影响,获取到的轨迹点可能存在一定的误差,针对这种数据问题,就需要进一步采用地图数据对其进行匹配纠正处理。较为简单的匹配方法,就是将GPS轨迹点与距离最近的道路进行匹配,主要原理是几何特性,基于道路拓扑关系进行匹配,能够简化匹配过程,且计算更为便捷、准确度更高。对初始数据进行相应的处理,最终得到的轨迹数据,应能够清晰的呈现为目标区域的道路网络。2利用出租车GPS轨迹数据挖掘居民出行特征的方案设计5学海无涯出租车GPS轨迹数据挖掘研究1出租车GPS轨迹数据挖掘技术分析1.1数据预处理。初步的数据采集,往往都是不完整的或不一致的,数据当中可能存在缺漏项

4、或重复项,所以不能直接用于数据分析与数据挖掘,需要进一步进行数据的清理与冗余数据化简操作。出租车的GPS轨迹数据当中,可能存在的问题主要包括两点,其一是轨迹点的经纬度坐标越界;其二时轨迹点位置异常。对这两种数据问题进行清理,可通过以下步骤:首先,处理经纬度坐标越界问题,假设数据采集对象为沈阳市辖区,则要划分重点研究区域,若此次研究主要为主城区的交通道路规划提供参考,则要将绕城高速以外的所有坐标记录进行清除处理。其次,处理轨迹点异常的问题,需要进行异常值过滤处理,如,数据的来源出租车的行车速度要控制在合理范围内;同时,还要有效剔除车载GPS的测量异常值,具体

5、办法可结合中位数滤波器进行有效处理。在数据采集过程中,受到交通拥堵、停靠等现实状况的影响,地位系统当中会出现大量的定位冗余点,若要保证数据分析的准确性,必须对其进行简化处理。针对这一处理过程,可充分利用计算机图形学与制图学领域的研究成果,采用Douglas-Peucker即DP算法,针对出租车GPS轨迹数据中曲线节点密度较高的数据类型,能够起到显著的去冗余效果。1.2地图匹配。在实际数据采集过程中,受到GPS定位精度问题的影响,获取到的轨迹点可能存在一定的误差,针对这种数据问题,就需要进一步采用地图数据对其进行匹配纠正处理。较为简单的匹配方法,就是将GPS

6、轨迹点与距离最近的道路进行匹配,主要原理是几何特性,基于道路拓扑关系进行匹配,能够简化匹配过程,且计算更为便捷、准确度更高。对初始数据进行相应的处理,最终得到的轨迹数据,应能够清晰的呈现为目标区域的道路网络。2利用出租车GPS轨迹数据挖掘居民出行特征的方案设计5学海无涯2.1高斯定理与轨迹数据。采用高斯定律进行居民出行特征挖掘,是一种类比的应用手段,主要原理是利用高斯定律描述目标场景,进而细致分析出租车轨迹方向与载客数量等特征。高斯定律数学表达公式如下:式中的Ω表示一个封闭曲面,而V则表示由这个封闭曲面所围成的空间;0ε表示介电常数;E表示空间V当中的电场

7、分布矢量函数;而qi则表示空间V当中所包含的电荷。对其进行直观的理解,即公式所表示的的封闭曲面内所包含的电荷之和,与穿过该曲面的电场线呈正比关系。将其类比于出租车GPS轨迹数据挖掘的过程当中,即表示在出租车GPS轨迹数据当中,一个载客段就对应高斯定律当中的一条电场线,而载客段所形成轨迹的起点与终点则为高斯定律当中的正负电荷;假设研究范围内的出租车载客量趋于稳定,皆为1/0λ,则能够进一步得出出租车穿过制定区域的轨迹正比于区域内所有载客段起点与终点之和。将高斯定律类比与出租车GPS轨迹数据,针对尺度不同的区域,其起点与终点之和能够进一步表现各个区域尺度下的载

8、客净流入量密度空间,具体表达公式如下:(count终点-count

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。