利用出租车轨迹数据挖掘城市居民出行特征

利用出租车轨迹数据挖掘城市居民出行特征

ID:40159828

大小:912.60 KB

页数:5页

时间:2019-07-23

利用出租车轨迹数据挖掘城市居民出行特征_第1页
利用出租车轨迹数据挖掘城市居民出行特征_第2页
利用出租车轨迹数据挖掘城市居民出行特征_第3页
利用出租车轨迹数据挖掘城市居民出行特征_第4页
利用出租车轨迹数据挖掘城市居民出行特征_第5页
资源描述:

《利用出租车轨迹数据挖掘城市居民出行特征》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第31卷第6期地理与地理信息科学Vo1.31No.62015年11月GeographyandGeo-InformationScienceNovember2015doi:10.3969/j.issn.1672—0504.2015.06.020利用出租车轨迹数据挖掘城市居民出行特征张俊涛,武芳,张浩(1.信息工程大学,河南郑州450002;2.西安测绘信息技术总站,陕西西安710054)摘要:通过用户产生的历史轨迹数据对城市的热点区域以及居民出行行为的时空特性进行挖掘研究逐渐受到重视,且取得了一定的进展。受电动力学中高斯定律的启发,该文在前人关于轨迹数据处理的基础上,针对出租车轨迹数据,将轨迹的方

2、向和数量特征考虑在内,提出了一种基于高斯定律思想的轨迹挖掘方法,通过对不同时段出租车轨迹数据的挖掘,发现城市居民出行行为的时空特征以及城市的热点区域。关键词:轨迹数据;轨迹挖掘;高斯定律;出行特征中图分类号:U491.1文献标识码:A文章编号:1672—05O4(2O15)06一O1O4一O5律思想的出租车轨迹挖掘、分析方法,以南京出租车0引言轨迹数据为基础,通过对不同时段数据的挖掘分析,近年来,移动定位技术在车载移动终端、移动设得到城市不同区域、不同时段乘客(居民)净流入量情备上得到广泛使用,使得大量群体轨迹数据的获取况的时空分布,发现城市居民的出行行为时空特征。在技术上及经济上可行性越来越

3、高,大量的轨迹数1数据预处理据在日常生活中日益积累并为不同类型的应用服务,通过对这些轨迹数据的挖掘、分析,将有益于城从现实世界直接采集的数据或多或少都是不完市规划、城市交通管理以及智能的基于位置的服务。整的、不一致的,并不能直接用于数据分析、挖掘,出关于轨迹数据挖掘、分析的研究,从研究对象的租车轨迹数据也不例外。基于研究需要,本文从数数量特征看,分为个体行为特点r1-3]以及群体行为据清理、冗余数据化简以及地图匹配三方面对原始特点_4]的研究。由于出租车轨迹数据主要是通过出租车轨迹数据进行预处理。不同出租车(车辆ID)对产生轨迹数据的个体进行区1.1数据清理分,而对于实际上某段轨迹真实所属的个

4、人则难以数据清理过程通过处理数据中的缺失值、光滑区分,故利用出租车轨迹数据挖掘、分析城市居民出噪声数据、识别和删除离群点来解决原始数据中存行行为特点实质上是一种利用轨迹数据进行群体行在的不完整性和不一致性问题。出租车轨迹数据存为特点的研究。当前此类型研究主要通过定义一系在的主要问题是轨迹点经纬度坐标越界以及轨迹点列适用于不同应用场景的距离度量指标l_6],依赖位置异常,需要对其进行处理。1)经纬度数据越界于数据挖掘中聚类的方法及其衍生方法进行,其中处理。本文以南京市辖区为研究对象,重点研究区典型的方法有:针对轨迹点直接进行基于密度聚域为南京绕城高速以内区域(主城区),放宽到整个类[10,ii;

5、将轨迹点转换为化简的线段序列,通过对线南京市辖区范围,不在此地理坐标范围内的记录应段的聚类以发现热点路径E12,13;将轨迹转换为某类予以去除。2)异常值过滤。直观的,出租车的行车型的格网序列,在格网上聚类以发现热点区域_1引。速度应在一定的合理范围内[1,此外,车载GPS设这些类型的方法存在一个问题,即未能考虑轨迹的备由于测量误差会产生一些异常值,本文采用文献方向和数量特征对结果可能产生的影响,因为轨迹[16]的方法配合中位数滤波器进行异常值过滤口。在某种程度上代表的是具有数量特征的一种流向1.2冗余数据化简(人流、物流等)。轨迹数据在采集过程中由于交通拥堵、车辆停受电动力学中高斯定律的启发

6、,本文将出租车轨靠以及缓慢移动的情况下定位系统会产生大量的定迹的方向和数量特征考虑在内,提出一种基于高斯定位冗余点,故需对其化简以便使用。轨迹数据的化收稿日期:2O15—O5—_25;修回日期:2O15—O9—09基金项目:国家自然科学基金项目“城市建筑群空间分布模式的识别方法研究”(41471386)作者简介:张俊涛(1987一),男,硕士研究生,助理工程师,研究方向为空间数据挖掘与制图综合、高性能服务器端技术。*通讯作者E一mail:Wufang_630@126.corn第106页地理与地理信息科学第31卷在统计穿过平面上一定区域边界的出租载客段操作记为operation(),具体的计算过

7、程为:1)邻域的轨迹时,计算轨迹是否穿越区域边界较为复杂与统计/栅格计算。通过r×r大小的窗口统计和栅格耗时,而直接统计区域内的载客段起点与终点数较计算得到乘客净流入量的局部极大值栅格:In一z简单,鉴于此,本文的出租车轨迹挖掘算法设计如一1j—boolean((neighbor—max×r([passagers—in—下:1)对获取的出租车轨迹数据进行预处理,然后依come])一[passage

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。