欢迎来到天天文库
浏览记录
ID:38229031
大小:163.62 KB
页数:3页
时间:2019-06-01
《基于聚类分析方法车站提取模型》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2006年12期增刊计算机系统应用基于聚类分析方法的车站提取模型TheModelforAcquiringStationsInformationBasedontheClusterAnalysis阚劲军周志逵曹新平(中国民航信息网络股份有限公司100010)摘要:本文通过实用数据分析方法一“聚类分析”应用于城市公交刷卡乘车数据的分析统计,得到对应于公交线路的车站站点的时间间隔OD信息,对于公交规划的评价和优化起到辅助作用。关键词:聚类分析聚合法公交规划1引言现在城市发展中,公共交通是必不可少的出行工具。城市公共交通是城市社会活动、经济活动的枢纽
2、和动脉,对城市经济发展和人民生活水平的提高起着极其重要作用。近年来,随着人口的增长,国民经济的高速发展及城市化进程推进,我国大多数城市出现了严重交通拥挤现象。对于一座大中型城市,一方面是人口增加明显,现有公交车辆不能满足出行人数,另一方面是一些公交线路的编排规划不合理,致使客流密度与公交线路不符。本文致力于公交线路优化设置需要,采用常用数学分析方法,提出基于聚类分析的车站提取模型。这是基于现代城市中刷卡乘车的数据记录进行公交规划的分析与改进的一部分工作。对于使用刷卡乘车计费的城市公交规划可以起到辅助作用。2模型的提出2.1聚合法刷卡数据开始
3、时每个个体自成一类,然后将刷卡时间间隔最近的的类进行合并,使类的数目减少,然后再将刷卡时间间隔最近的类进行合并,如此下去,最后形成对应于每个车站的刷卡数据集合。2.2Q型聚类对于n组刷卡样品数据(X。,X:,O··Oral,X。,),对样品进行的聚类称为Q型聚类。2.3站间时间间隔(非类似度)对于n组刷卡样品数据,视rl组样品为p维空间的n个点,用dij表示第i组刷卡数据所属车站与第j组刷卡数据所属车站之间的时间间隔。di应满足如下条件:(1)d。;=0当第i组样品与第j组样品相等(2)dii90对一切i,j(3)d。=dj,对以前i,j(
4、4)d“≤d止+d与对一切i,j,k用类平均法定义两个车站站问时间间隔:%2衰p2.4相似系数刷卡数据属于间隔尺度变量,设刷卡样本(X,,x:,⋯⋯,X.,)的相关矩阵为R,则有相关系数善(x池一xt)(x,k—xj)~一r。叉。)2。砉(x,。一i。)2]+利用相关系数决定刷卡数据所属车站的合理时间取值。2.5算术均值x2iI蜀"Xi应用于多次计算各种平均时间。3用打卡数据确定车站算法的实现方法算法的流程大致如图1所示。第一步:将打卡数据统计成时间间隔数据(差分数据)TS,记录间隔总数(相当于车站数)NS。方法:按顺序比较每名乘客(根据打
5、卡时间记录)打卡的时间间隔,如果两名乘客刷卡的时间间隔小于计算机系统应用2006年12期增刊由相似系数分析后的取值(根据分析,取1.5分钟比较合理),则认为是同一车站上车的乘客,累计该时问间隔,否则累计该时间间隔后记录累计结果,再将累计值清零,车站数加一。处理结果以每个班次为单位保存为数组,数组成员为各个车站的运行时间和停站时间之和。开始将打卡数据统计成差分数据统计平均时间间隔TAVG剔除坏的打卡数据对全程运行时间做归一化处理求调整后的站问运行时间间隔计算实际站间运行平均时间漏站预增补统计平均车站数NAVG增、波车站处理J,I求站问的垂直平
6、均时间间隔J,输出统计结果图1打卡数据确定车站算法流程第二步:按不同时段对所有白勺时间间隔统计平均时间间隔TAVG。(作为剔除坏数据的阀值标准)方法:如取7—8点间发车的数据,将所有的时间间隔相加除以时间间隔总数获得平均时间间隔TAVS,(即车站间的平均行车时间)。第三步:剔除坏的打卡数据(由于长时间堵车,坏车或连续多个车站不上乘客造成)。方法:按顺序检查某次出车的所有站问的时间问隔Ts,如果存在TS>4×TAVG(其中,选取四倍是基于经验总结),则剔除这次出车的所有打卡数据(删除该班次对应的数组)。第四步:对全程运行时间做归一化处理。将各
7、个班次的所有站间时间间隔相加,得到各个班次的统计运行总时间TSA,设实际的运行总时间为TBZ,则TBZ和各个班次的统计运行总时间TSA相除得到各个班次的调整系数KSA。方法:按顺序提取各班次的站间时间间隔数据,依次累加,累加的结果为TSA。实际运行总时间TBZ来自公交班次运行手册。用TBZ和各个班次的TSA相除得到各个班次的KSA。第五步:将各个班次的各个站间运行时间间隔均乘以该班次的调整系数KSA。得到调整后的站间运行时间间隔TSK。方法:按顺序提取各班次的站间时间间隔数据,依次和该班次的KSA相乘得到调整后白勺站间运行时间间隔TsK。第
8、六步:计算实际的站间运行(包括站内停靠)平均时间TSR。方法:根据实际调研结果(站问的距离),将运行总时间按站间距离的比例进行分割,分割得到的时间作为实际站间运行平均时间TSR如
此文档下载收益归作者所有