欢迎来到天天文库
浏览记录
ID:23978990
大小:70.50 KB
页数:4页
时间:2018-11-12
《基于数据挖掘技术的交通事故关联分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于数据挖掘技术的交通事故关联分析杨东红安汽车科技职业学院基础课教学部摘要:基于数据挖掘在潜在价值信息发现、具备大数据量处理能力等优势,采用关联规则挖掘方法对英国近10年交通事故数据进行分析,本文通过Python语言建立Apriori关联规则挖掘模型,分析交通事故发生的频繁因素集,发现交通事故数据中存在的关系和规则,从而为交通事故预警和管理提供数据决策支撑。关键词:数据挖掘;关联规则;八priori;交通事故;作者简介:杨东红(1988一),女,汉族,河南商丘人,理学硕士,研究方向:微分方程数值解、机器
2、学习。收稿日期:2017-10-25TrafficAccidentCorrelationAnalysisBasedonDataMiningTechnologyYangDonghongDepartmentofBasicCourses,Xi’anAutomotiveScienceandTechnologyVocationalCollege;Abstract:Basedontheadvantagesofdatamininginthediscoveryofpotentialvalueinformationand
3、theabilityoflargedataprocessingcapacity,thispaperanalyzesthetrafficaccidentdataofBritaininrecent10yearsbyusingassociationruleminingmethod.ThispaperestablishestheAprioriassociationruleminingmodelthroughPythonlanguage,analyzesthetrafficaccidentFrequentfact
4、orsset,foundinthetrafficaccidentdataintheexistenceoftherelationshipandrules,soastoprovideearlywarningandmanagementoftrafficdatadecisionsupport.Keyword:Datamining;Associationrules;Apriori;Trafficaccident;Received:2017-10-25随着社会经济快速发展,科技水平和人们生活提升,机动车数量近年来呈
5、现出逐年大幅度增长的趋势。交通建设的进度远远跟不上tl益增长的车辆数,随之给城市交通带来丫巨大的压力,导致交通堵塞问题严重、交通事故口益频发m,导致国家和人民大众大量经济损失。在传统的交通事故分析中,多数采用统计学描述方法,通过事故发生概率、分析事故发生规律,基于这些规律给出一些交通相关参考意见。而数据挖掘作为一种从大量的数据中发掘有价值信息的技术,能给予决策人员基于有价值信息通识全局和潜在情况,并制定相应决策。本文针对英国交通事故历史数据进行分析,利用数据挖掘技术挖掘出有效的关联规则,探讨和同类型交通
6、事故发生规律,进而通过天气、道路情况等确定其可能的交通事故,利用关联规则实现关联事故的提前预警。同时,了解车辆参数、驾驶员信息对交通事故发生的潜在影响,掌握交通事故多因素关联关系。数据挖掘是指从大量的数据中通过算法搜索隐藏于其中潜在价值信息的过程m,自上世纪70年代起至今,数据挖掘从理论到实践得到了快速进步,特别是在应用实践屮,其已涵盖人类生活的方方面面。图1Apriori算法流程图下载原图数据挖掘常用的分析方法有分类、聚类、预测、关联规则等,其中关联规则分析由于其在商业领域的众多成功应用,使得该方法在
7、数据挖掘领域成为一个重要分支。1.1关联规则1.2支持度若项集满足最小支持度,则称之为频繁项集。U表示频繁k-项集的集合1.3置信度关联规则的置信度是指包含X和Y的事务数与包含X的事务数之比[3],即:1.4Apriori算法Apriori算法采用逐层搜索的迭代方法,在分类上属于布尔型关联规则£41,反复冲频繁K-项集去寻找频繁(K+1)-项集。首先遍历事物库,找出频繁1-项集的集合。记作Lb将L自连接从而生成频繁2-项集的集合U,而L2生成U,如此下去,直到不能找到U即频繁K-项集。Apriori算法
8、的流程图如图1。2实验基于数据挖掘技术的交通事故关联分析包括3个步骤:(1)数据预处理,由于数据存在大量缺失、异常数据等问题,因此需要进行数据预处理,包括缺失值处理、异常值处理、属性变换、数据离散化等问题。(2)建立挖掘模型,挖掘关联规则。(3)模型评估与分析,评估模型结果和分析关联规则挖掘结果。数据来源于英W交通部公布的2005-2015年交通事故数据,共包括1780653条交通事故数据,该数据集涵盖了交通事故发生的地点、时间、道路类型、
此文档下载收益归作者所有