欢迎来到天天文库
浏览记录
ID:46658324
大小:61.00 KB
页数:4页
时间:2019-11-26
《信息化视角下的数据仓库检索优化策略》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、信息化视角下的数据仓库检索优化策略摘要:信息化视角下的数据仓库检索优化是随着商业智能的不断推广应用而提出了的提升数据检索效率的有益尝试。木文正是基于对此的认识,从数据仓库索引检索的技术优化入手,探讨了数据仓库的优化策略。关键词:信息化视角数据仓库检索优化屮图分类号:TN392文献标识码:A文章编号:1007-9416(2013)11-0202-01数据仓库主要特征在于决策支持和联机分析处理数据的结构化数据环境。可以实现对数据的分析、抽取和转换,并按决策主题进行重新组织以达到系统FI标。它建立在关系型数
2、据库、并行处理和分布式计算技术的基础上。随着数据量的不断增大,数据量已经突破了传统数据库的容量,在海量的数据面前,数据仓库的查询性能面临着较人的压力,如果改善数据库检索性能,加快数据检索匹配速度,显得尤为迫切和重要。因此,加强对信息化视角下数据仓库检索优化策略显得很有必要,并成为近些来商业智能运用中的热门话题。1数据仓库及OLAP技术的起源随着技术的发展和商业应用的不断推广,数据量从之前的兆字节及千兆字节逐渐向兆兆字节和千兆兆字节过渡,同时对用户查询的要求更加苛刻,已经不是对一张关系表中的某一条记录进
3、行查询,而是涉及多张表的千万条记录的查询。数据应用类型也实现了多样化的发展。1993年EFCodd提出的联机分析处理(OLAP,onLineAnalyticalProcessing)为数据处理提供了新思路。OLAP主要特征是快速响应用户的分析请求,此外,OLAP其他的特征如数据分析、共享性等功能也是它的一大特色。OLAP的这些独特优势从其它角度解释了概念的产生即“FASMTtest”。关系型数据库实现了些分析型的应用,虽然在性能方面有所提升,但引入杂乱无章的统计和综合数据功能,因而不能较好地支持OLA
4、P的应用,为了提高对OLAP的支持,数据仓库的概念也就应运而生了。这是一个功能强大的数据集合,较好地支持决策分析处理、面向主题并且随时间不断变化。2信息化视如下数据仓库检索优化策略分析研究很多大型的企业机构都针对数据仓库的检索和存储优化都采用了新的技术,提高了数据检索效率,方便了客户,尤其是一些金融机构,如银行、证券公司等都加大了对数据的分析处理力度。细分客户信息,加强对客户数据的跟踪管理,将零散的、无规律的、冗余的数据集结起来构建庞人的数据仓库,然后再从数据仓库中挖掘有价值的信息并建立相应的数据模型
5、,以实现对数据信息的动态跟踪,挖掘潜在客户价值,从而提升企业的市场竞争力。因此,数据仓库的存储和检索效率是影响基于数据仓库的决策支持系统,并成为影响系统运行效率的主要因素。以下通过例子来详解数据仓库检索效率的提升。例子屮冇四个外键,如CompanyAccout(机构账号),OrganNO(子公司账号),TradeNO(交易账号),ItemNO(科目账号),如图1所示,将这四个外键单独取出,就组成了四个单独的索引表,其它的信息统一组成一张表,这样就打破了原來的表结构,将表打乱成五个部分,在拆分后的表结构
6、中既可以体现出原来的表结构,又构成了索引表,但索引表需要为相应的记录增加行编号。由于行编号在每个表中具有一定的唯一性,且不同的表行编号具有一一对应的关系。这种构造方法虽然多出了一部分行编号空间,但具备数据索引检索的功能。通过这种表结构构成,可以快速响应用户的数据请求并检索到索引表以及相应表中的目标数据。这是数据检索方法的创新应用,这种优化检索策略运用于实际的信息系统中无疑将显著提升运行效率,比如原来在检索CompanyTrade表的1条记录需要从表的起始位置开始检索,逐条扫描,直到完成为止。检索时涉及
7、到每条记录的所有字段,每条记录的字数总数为50013。因此,扫描范围就是3000000*500B,如果换做是索引表,那么检索效率将会大大提升,不需要检索表的所有记录了,只检索索引表中的信息就可以了,然后再根据索引表中的信息,去检索相应表的信息即可。需要说明的是,这种数据仓库检索方法具冇•定的适用性,在现实运用中,数据检索还与其它很多因素密切相关,这些影响因素都会影响到数据的检索效率。这种方法具有一定的局限性,只对关键字的检索情况能够起到相应的优化提升作用。而对于非关键字的检索,不能减小相应的范围。所以
8、这种方法只是对数据仓库检索和存储策略的试验,还有许多需要改进和提高的地方,方能实现数据检索的广泛运用。3结语商业智能是近些年来IT业界关注的热点和焦点,数据仓库、联机分析处理(OLAP)和数据挖掘是商业智能运用的三大支撑技术,而OLAP又是数据仓库的核心运用之一,涉及到海量复杂数据的检索优化,在数据检索中,响应速度是关键,也是数据仓库研究的热点问题之一。随着数据量的增加,数据仓库在数据检索过程中的压力越来越大,为了及时响应查询需求,提高检索效率,多采用索
此文档下载收益归作者所有