欢迎来到天天文库
浏览记录
ID:6074590
大小:27.50 KB
页数:6页
时间:2018-01-02
《基于数据挖掘交通数据管理平台》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、基于数据挖掘交通数据管理平台 摘要:数据库在交通领域的广泛应用使得该领域积累了大量的数据,这些数据间存在着潜在的规则和关联,通过数据挖掘技术的应用可将这些潜在的规则和关联显性化,对交通管理的决策有着重要的作用和意义。本文构建了一个基于数据挖掘的交通管理平台为交通管理决策提供支持,并说明了该平台数据挖掘的流程。关键词:交通管理数据挖掘平台中图分类号:N37文献标识码:A一、引言目前公安交通机关为方便交通管理业务的开展,创建了四个基本数据库:道路交通事故信息数据库、驾驶员(即驾驶证)管理信息数据库、交通违法行为信息数据库、车辆登记管
2、理信息数据库,当前交通管理部门的应用系统、平台均以此四个基本数据库为基础获取各类信息。数据库自创建以来经过几十年数据的存储,已积累了海量的交通相关数据,随着车辆和驾驶人增多以及相关业务的复杂化,数据更是成爆发式增长。这些数据已成为交通部门的重要的数据财富。6然而面对大量数据,显然已不能再满足于只是简单地查询和修改数据,而是进一步希望能够发现数据之间的潜在关系,并随着现实中交通管理中“人、车、路、环境”和谐发展的迫切期望以及缓解交通堵塞、预防交通事故的职责所在,交通管理部门急切地希望通过快速处理这些数据获得进一步有利于科学管理的决策
3、依据。特别是以往的交通管理规律常常不是基于数据库中信息丰富的数据,而是基于决策者的直觉,因为决策者缺乏从海量数据中提取有价值知识的工具,即使当前的专家系统技术,通常这种系统依赖于用户或交通管理领域专家人工地将知识输入知识库,因此这一过程可能会产生偏差和错误,并且耗时、费用也高。如何才能对大量数据进行分析,发现数据之间的潜在联系,为交通管理提供自动决策支持呢,运用数据挖掘技术从交通管理数据库中寻找知识发现给交通管理部门带来了希望。在这些海量交通数据中存在着大量的有着潜在关联和规则的数据,因此将数据挖掘技术中的关联规则算法应用在交通领
4、域,通过关联规则挖掘发现交通数据之间的潜在关系,为交通管理提供自动决策支持有着重要的意义。本文设计了一个交通管理数据挖掘平台方案,并对平台架构和挖掘流程进行了详细分析和讨论。二、交通管理数据挖掘平台架构6在交通数据库中,所涉及的违章信息、驾驶员信息、机动车信息比较繁琐。交通数据的特点是:交通数据库的核心业务表较多、表的定义复杂、表中的数据量大、表数据的实时更新速度快。数据间的潜在关系和规则未被发现和利用,目前的处理还是停留在见到的统计报表,没有智能性的分析处理。这些交通的原始数据对于交通管理决策支持有限,需要设计一个基于数据挖掘的
5、交通管理数据挖掘平台对交通数据进行有效的挖掘和分析,对交通决策提供有力的支持。图1给出了我们所设计的交通管理数据挖掘平台框架,该平台主要由三部分组成:数据仓库模块、数据分析处理模块和接口与会话管理模块。1、数据仓库。在辅助决策方面,数据仓库能为其提供高质量、纯净、集成的数据,从而极大地提高决策支持系统的性能与信息分析能力,因此,数据仓库业已成为进行数据分析与挖掘的基础平台。构建交通信息数据仓库是本系统结构的核心,其实现形式包括:数据采集与ECTL(数据抽取、转换和装载)、数据仓库管理系统、元数据管理系统三部分。本系统采取星型模型建
6、模,其中,主题是其基本组成单位,每个主题由多个事实表和维表组成,而一个事实表可以关联多个维表,构成一个以事实表为中心的星型结构,多个星型结构共同组成一个主题。在建模过程中,考虑到智能交通领域涵盖范围广泛,要求数据仓库具有很强的可伸缩性:既可以集成智能交通领域交通流采集系统、信号控制系统、电视监控系统、违章取证系统、公路车辆监测系统、122接处警系统、GPS车辆定位系统、可变情报板显示系统等各个应用系统提供的交通信息,又可以针对特定应用系统。6图1交通管理数据挖掘平台框架62、数据分析处理模块。在数据仓库基础上直接采用的智能化分析技
7、术主要有:联机分析处理、数据挖掘和知识发现技术。联机分析技术的主要功能是进行多维数据分析和生成报表,专门用于支持复杂的分析操作,侧重对高层管理人员和决策人员的决策支持,可以应分析人员要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观易懂的形式将查询结果提供给决策人员。本模型将数据仓库中建立的多维逻辑视图直接映射到数据立方体结构上,以方便对预计算产生的数据进行快速索引,当数据集稀疏时,采用稀疏矩阵压缩技术提高存储效率。通过对数据立方体(DataCube)进行下钻(Drill-down)、上卷(Roll-up)、切分(Slic
8、eandDice)以及旋转(Pivot)等操作,实现不同角度、不同层次的数据分析,例如:对交通负荷时空分布信息运用联机分析技术处理,通过切片、切块、旋转细剖低级别的详细数据和统揽较高级别的概括性数据,快速地响应查询。数据挖掘与知识发现技术是从海量数
此文档下载收益归作者所有