欢迎来到天天文库
浏览记录
ID:22887584
大小:53.00 KB
页数:6页
时间:2018-11-01
《关于数据挖掘在地铁行业的应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、关于数据挖掘在地铁行业的应用导读:数据挖掘在地铁行业的应用是一篇关于数据和客流方面的论文参考,适用于本专业专科生和本科生以及硕士研究生在撰写毕业论文时阅读参考借鉴,希望对学生们的论文写作启到帮助。关键词:数据挖掘地铁自动售检票系统聚集算法视化技术中图分类号:TP311文献标识码:A :10092374(2012)17007804地铁作为城市的轨道交通系统的运行方式,其运行过程中要满足高效率、高密度的要求,对地铁业务的控制系统和监控系统提出了高要求,控制系统要完成对控制设备的操作反馈状态,监控系统要完成时时监控.这两个系统中,对于数据的处理需要及时准确,
2、以保证地铁运行的正常运行.随着信息技术的快速发展,数据库规模不断扩大,传统方式的查询、报表工具不能满足挖掘有效信息的需求.需要一种新的数据分析处理技术处理大量数据,从中抽取有价值的潜知识,这是数据挖掘技术的产生价值.1 数据挖掘技术1。1 产生的背景信息技术得到了迅速地发展,数据库应用的规模也不断地扩大,这样产生了庞大的数据,许多领域均建立了数据库,能给决策者提供统一、全局的视角,但数据的庞大使人们没有办法来辨别隐藏的对决策有用的信息,传统查询方法和报表工具根本不能满足信息挖掘的需求.以,需要一种方法来分析数据技术和处理此庞大的数据,从中选择有用的价值
3、,发现潜的价值,由此产生了数据挖掘技术.也以说,数据挖掘技术也是数据仓库技术逐步发展和完善的结果,但不是有信息发现的任务都以视为数据挖掘,例,信息检索以用数据库的管理系统来查找个别记录,或通过X络的搜索来查找特定的页面.1。2 概述以数据库、数理统计、人工智能、视化作为数据的基础,用来描述或者说明算法的设计.算法的设计分为输入、输出及处理三个过程.数据库为数据挖掘的算法输入,算法输出是发现数据知识或者模式,算法处理的过程是设计本篇关于数据挖掘在地铁行业的应用论文范文综合参考评定下度:经典题目具体搜索的方法.1。3 分类从数据库的角度来确定数据挖掘的三个
4、方面,分为挖掘角度、挖掘对象、挖掘方法.挖掘对象包括若干种数据库或数据源,例关系、面对对象、空间、时态、文本库、多媒体、历史等方面的数据库以及万维X等.挖掘方法粗分为统计方法、机器学习方法、神经X络方法和数据库方法.统计方法细分为回归分析、判别分析等.机器学习细分为:遗传算法等.神经X络方法细分为:前向神经X络、自组织神经X络等.数据库方法主要是多维数据分析方法等.1。4 作用数据挖掘是指自动抽取数据集合中隐藏的有用信息的过程,信息的形式以表现为规则、规律、概念和模式等.帮助决策者分析当前数据、历史数据以及两者间的关系,从中发现隐藏的模式和关系,从而预
5、测将能发生的事情.其过程也是发现知识的过程,是涉及面很广的新兴交叉性学科,主要应用于数据库、数据统计、人工智能和视化及行计算的领域.1。5 常用技术形式数据挖掘学习知识的重要方法是机器学习与数理统计的方法,目前研究数据挖掘主要集中算法和应用的方面.机器学习作为另一个人工智能的分支,被称作归纳推理关联分析法,关系数据库中提取关联规划,挖掘关联是通过系统搜索有事物,找到条件概率较高的模式数据挖掘中人工神经元X络应用最广泛,方法是模仿人神经系统,反复地训练和学习相关的数据集,待分析数据的集里,发现预测和分类的模式决策是一种预测模型,呈树型结构,非终端节点示属
6、性,叶节点示不类别遗传算法是基于优化生物进化理论的一种技术,基本观点适者生存,遗传算法能处理多种数据类型,行处理数据聚集发现,整个数据库分成不群组,目的是群与群间差别明显,群数据量相似.此涉及到的聚类分析作为其算法特征和分类等预处理的步骤,算法生成的簇上等待处理.和分类不的是开始聚集前,不知道把数据分组,也不知道依照变量何分.此,聚集后,一个对很熟悉业务的人解释分群的意义有许多的方法.很多情况,下一次聚集得到的分群对业务不,此时需删除或者增加变量,来影响数据分群的几种方式.这样,经过反复几次后,会得到一个很理想的结果.聚类方法两类,其中包括神经X络方法
7、和统计方法.K均值和自组织的神经X络方法聚集算法中比较常用.另外,数据挖掘技术统计分析方面和视化技术环节的应用上有着非常广泛的指导意义.2 地铁自动售检票系统自动售检票系统是基于计算机、数据库、系统集成、通信X络、自动控制等技术,实现轨道交通票卡发行和制作、售票、检票、收益、统计和分析、清分、管理等全过程的复杂自动化系统,整个系统直接为乘客提供服务,与服务、客流、收益等密切相关,而对自动售检票系统产生的有数据进行完整的集成和挖掘.2。1 智能决策分析系统的系统架构由于现有自动售检系统是独立的X络,处于本系统内X范围目前自动售检系统数据库中仅存放60天数
8、据,根据业务需求和系统安全性的需要,首先采用增量备份策略,将自动售检系统数据库数据备份到备份数
此文档下载收益归作者所有