交通流量数据的分类规则挖掘

交通流量数据的分类规则挖掘

ID:33539918

大小:121.98 KB

页数:3页

时间:2019-02-26

交通流量数据的分类规则挖掘_第1页
交通流量数据的分类规则挖掘_第2页
交通流量数据的分类规则挖掘_第3页
资源描述:

《交通流量数据的分类规则挖掘》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、交通流量数据的分类规则挖掘巩帅(清华大学软件学院,北京100084)摘要概述了数据挖掘的分类算法,并简要介绍了C5.0决策树算法。以北京市“三横两纵”主干道交通流量数据为例,采用C5.0决策树算法提取交通流量的分类规则,用于分析交通流量规律、信息模式和数据趋势,并对分类树进行量化,为交通信号设计、路网规划、道路设计、路网节点设计等提供决策支持。关键词交通流量数据分类规则数据挖掘C5.0决策树算法文章编号1002-8331-(2006)06-0219-02文献标识码A中图分类号TPU491.1MiningCl

2、assificationRulesfromTrafficFlowDataGongShuai(SchoolofSoftware,TsinghuaUniversity,Beijing100084)Abstract:Classificationalgorithmsofdataminingarereviewedbriefly,andC5.0decisiontreealgorithmisintroducedconcisely.Takingtrafficflowdataofthe"Three-horizontal&Tw

3、o-longitudinal"arteriesinBeijingasanexample,C5.0decisiontreealgorithmisappliedtoextracttheclassificationruleshiddenintrafficflowdatatoanalyzetrafficrules,patternsandtrends.Theclassificationtreearequantifiedtohelpmakedecisionsforthedesignoftrafficsignaltimi

4、ngplans,trafficnetworklayouts,roadsandintersections.Keywords:trafficflowdata,classificationrule,DataMining,C5.0decisiontreealgorithm1引言描述。第二步,使用类别的模型或描述对测试样本集中的数据随着中国加入WTO和汽车价格的下调,私家汽车的数量进行分类,预测这些数据所属的类别,从而对这些类别有更好的理解[4]。大幅度增长,对道路交通也提出了更大的需求,但单纯地修建道路基础设施是不

5、能完全解决这一问题的。智能交通管理系统随着数据挖掘研究的不断进展,已经提出了很多分类规则是解决交通拥堵、改善交通条件、降低交通事故发生率、减少尾挖掘的算法,这些算法包括决策树归纳、贝叶斯分类、基于关联气污染和提高交通管理水平的有效手段和方法。系统通过各种规则分类、数据仓库技术、神经网络、遗传算法、模糊集、粗糙集检测器(包括环形线圈检测器、微波检测器、视频检测器等)实等,算法综述参见文献[5]。这些算法根据出发点的不同,可分为时采集动态的交通流数据,其中包含交通流量、车速、车辆占有Lazy和Eager两种类型

6、。Lazy类型的算法从局部出发,推迟对率等信息,这些数据被广泛应用于交通信号的实时合理调配、训练样本的归纳过程,直到一个新的测试样本出现,如K近邻发布动态交通信息等,同时传送并存储在交通控制中心的数据算法;Eager类型的算法则是从全局出发,在新的测试样本出现库中[1]。但是这些积累的海量交通时空数据并未得到有效的组之前,由训练样本总结归纳出相似判断的目标函数,这个目标函数应用于训练数据和测试数据,如决策树算法[6]。这些算法比织和利用,进行深层次的加工处理,其中潜在的交通流量时空规律并未发现,造成了数据资

7、源的浪费。要有效地处理海量交较和评估的标准则必须考虑到以下内容:准确度、速度、鲁棒通数据库的信息,找出其中蕴涵的规律[2],数据挖掘为我们提供性、可伸缩性、简易性和可解释性[4]。了一种发现知识、规律和信息的有效技术[3]。作为数据挖掘中应最为典型的分类方法是基于决策树的分类方法,是一种有用领域极其广泛的一项技术,分类规则挖掘用于发现同一类别指导的学习方法。决策树是一个类似于流程图的树结构,首先数据样本的共同点,并利用此规则对未知类别的数据样本进行根据训练样本数据集生成。如果该树不能对所有对象作出正确分类,

8、从而发现信息模式和未来数据的趋势,辅助相关部门作的分类,那么选择一些例外的样本加入到树中,重复该过程一好决策。直到形成正确的分类规则集(决策树)[4]。最终结果的决策树中,本文采用C5.0算法对北京市交通流量数据(以“三横两纵”叶结点代表类型或者类型分布,内部结点对应于一个属性的测主干道交通流量数据为例)进行分类规则挖掘,可以掌握交通试,每个分枝代表一个测试的输出,从根到叶结点的一条路径现状,分析交通流量变化规律

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。