基于民航商务系统的聚类查询

基于民航商务系统的聚类查询

ID:33483132

大小:763.79 KB

页数:3页

时间:2019-02-26

基于民航商务系统的聚类查询_第1页
基于民航商务系统的聚类查询_第2页
基于民航商务系统的聚类查询_第3页
资源描述:

《基于民航商务系统的聚类查询》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、ComputerEngineeringandApplications计算机工程与应用2009-06,45(专刊)89基于民航商务系统的聚类查询朱明ZHUMing中国民航信息网络股份有限公司,北京100010TravelskyLid.,Beijing100010,ChinaE——mail:zhuming@travelsky.COrnZHUMing.Clusteringofsearchincivilaviationsystem.ComputerEn萄neeringandApplications。20

2、09-06。45(专刊):89-91.Abstract:Usersneedmorecustomizinginformationintheprogressofcivilaviationbusiness.Buttheoldcivilaviationsystemcannotfulfillthedemandasitsframeworkanddatastructure.DataminingcannotbeputintoUSeevenifitcartsolvetheseproblems.Thispaperp

3、roposesanewsearchmodelbasedonclusteringintheoldsystem.Keywords:datamining;clustering;associationrules摘要:随着航空业务的不断发展,用户对于个性化信息服务的要求越来越强烈。但是传统民航信息系统由于系统架构和数据结构的限制,无法满足用户的个,眭化需求。而对实现个性化服务有效的数据挖掘技术无法应用在传统的系统当中。提出了一种新的思路,将传统数据库系统与先进的数据挖掘方式相结合,更大限度地满足用户需求。

4、关键词:数据挖掘;聚类;关联规则文献标i只码:A中图分类号:TP3111引言随着民航业务的飞速发展,航空用户对于个性化信息服务的需求日益强烈:航空公司和旅客越来越T-FOr足传统民航商务系统所提供的信息和服务,陈旧单一的界面,统一的数据内容都无法适应用户需求的快速增长和变化。但是由于现有民航核心系统的构架和数据结构,对于提升个性化服务有利的新兴网络和数据库技术又无法应用其中。本文的创新之处主要包括三部分内容:(1)建立一个新的系统模型,将数据挖掘技术应用于传统的大型主机系统,使得在不影响主机原有

5、架构和安全性的前提下,根据用户的需求实现个性化查询服务;(2)基于海量数据查询,应用相似度计算及关联规则的数据挖掘技术,提高查询效率和降低资源成本;(3)在应用聚类方法的过程中,传统的聚类方法用于民航现有客户群时,容易造成重要客户的丢失,因此对传统的聚类方式进行了改进。论文内容组织,第2章,介绍了基于聚类方法的个性化查询系统模型:第3章。用户事务建模,基于聚类的算法及其改进。第4章,实验与结果分析:第5章,总结与展望。2查询系统模理基于聚类的个性化查询系统如图1所示。在对民航数据源中的数据进行预

6、处理后,可以进行用户事务聚类,得出聚类集。结合在每—个聚类集中进行关联规则发现,为用户兴趣建模,同时实行个性化推荐,实现了个性化的服务。整个过程主要包括以下几个部分:(1)信息发现:根据查询条件从数据源资源中获得所需要的数据。以用户通过民航网站进行网上订票为例,如图2所示,值机以及酒店预订时的过程为例。根据旅客输入的查询条件,可以得到用户的基本情况,以及所查询航班、酒店、出行路线的信息。根据查询关键字,建立查询序列向核0擞据库进行数拄弥lj取。核心数据库的架构由图3显示。该结构类似树状的层次体系

7、,其子代数据的存储位置偏移量均由父代通过指针指定。建图1个性化查询系统902009埘,45(专刊)竺竺竺7111111型!竺!!!!!苎!j!!!!一——一~立关键字索引和存储暖冲医packet,将用户所壹询的*键字快靛位,进行抽数,得到数据源。(2)选择和目碰理:初始数据中可能会包舍异构数据,或者错误和缺失的数据.困此需基时异构数据进行转换,修m或剔除错醍数据,并对蛀虫数据进行补充或者预洲。在遮一步需要通过襄娄算法.对杳询结果进行改进,优化杳询反馈。(3)知识发现:通过归纳和概括,学日用户兴趣

8、模式,并阻数据的形式存于服务器中作为以后相同或判“用户查询聚娄的依据。(4)分析和阵价对学H的结果进行评估,并自动调整查询结果,3用户事务建模3.1捐慨度讪算耀户模式相似度计算是根据用户所青匈数据(剐览同页)的内容,停留时目“殛在询顺序等蒋十要煮进行Ⅱ配.计算m用户在整体事务中的柙,r堰,得到的不问用户的浆类。对于两个不同的用户模式U和U..如果“,有n十属性(维):c¨.cmc。,“有m十属性(维jom如,cn.逭驻定义“。和“的相似度屉各个属性相似度的最大值,表达公式为s。m(u。,“)=M

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。