dwms中列存储的研究与实现

dwms中列存储的研究与实现

ID:32941545

大小:3.80 MB

页数:104页

时间:2019-02-17

dwms中列存储的研究与实现_第1页
dwms中列存储的研究与实现_第2页
dwms中列存储的研究与实现_第3页
dwms中列存储的研究与实现_第4页
dwms中列存储的研究与实现_第5页
资源描述:

《dwms中列存储的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、DWMS中列存储的研究与实现1964:49代码:10255号:2070692ResearchandImpIementationofColumn—storeinDWMS学科专业:计算机软件与理论作者:彭青松指导教师:丁祥武答辩日期:201O年1月2009年12月/、

2、{大学学位论文原创性声明本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已明确注明和引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的内容。论文为本人亲

3、自撰写,我对所写的内容负责,并完全意识到本声明的法律结果由本人承担。学位论文作者签名:珈日期:0句【眇年f月/多日大学学位论文版权使用授权书学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。本人授权东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密口,在——年解密后适用本版权书。本学位论文属于/不保密吼学位论文作者签名:指导教师签名:日期:一叫矿年/月

4、佣日期:a口f矿年J月f阴·i摘要作为一种分析型的数据环境,越来越受到人们的重视。作型数据库环境相分离。相对于操作型环境而言,分析查询的速度提出了更高的要求。相对于行存储,列存储析型环境中具有明显的优势。为此早在一年多之前,作就开始基于列存储的数据仓库管理系统的研发工作。本文结合实际项目的研发,研究了数据库和数据仓库的数据存储技术、现有关系数据库管理系统和数据仓库管理系统的相关技术,特别是列存储技术,设计并实现了列存储数据仓库的存储结构和管理功能,包括外部存储和缓存。在缓存管理方面提出了一种基于双管理链的自适

5、应页面置换算法——HA算法(HybridAd印tiveAlgorithm)。首先,本文研究了传统I①BMS和行存储DWMS的数据存储,较详细地研究了行存储和列存储的DB实现方式,特别分析和总结了两种开源数据库PostgreSQL和C.Store的数据存储技术。在分析已有关系数据库存储的基础上,对基于列存储的数据仓库的数据存储进行了深入的研究,概要地设计了DWMS中列存储的整体结构和功能模块,详细阐述了DWMS中的文件管理器、缓冲区管理器和访问方法管理三个部分的设计与实现。DWMS中的数据存储分为两个方面:逻辑

6、层次结构和物理层次结构。文件管理器使用分层管理的思想将其分为操作系统文件管理、虚拟文件管理和DWMS文件管理三个部分。虚拟文件管理采用LRU算法淘汰文件句柄、哈希算法查找文件。缓冲区管理器是整个系统的核心和数据流枢纽。本文在通用的缓冲区管理算法的基础上提出了一种基于双管理链的自适应页面置换算法——HA算法,该算法是对DMC(2c)算法的改进,它引入动态置换点,同时,根据缺页失败数确定算法的工作链,并根据页面访问序列的局部特征选择效率较高的页面置换策略。实验结果表明,该算法的缺页率较改进前可降低近30%。B+树

7、索引是访问方法管理的一种重要的索引方式。本文主要介绍了该索引的结构、创建、查找和更新操作。最后,本文分析了DWMS存储管理器的性能,并提出了它的代价评估模型。结合该代价评估模型和系统的具体实现,从数据存储的角度提出了两个方面的优化:存储结构的优化和数据缓冲区管理的优化。具体优化的方法有:将数据项中的ROWID存储在数据块的头部信息中,节省存储空间;赃块的设置操作包含在块管理中,避免数据丢失;将段内包含的区信息保存在段控制块中,有利于段内数据扫描;哈希链采用双向链表的结构,节省哈希查找时间和便于更新操作;将数据

8、缓冲区进行状态设置,减少批量数据导入时数据缓冲区管理代价。关键词:DwMS,列存储,数据缓存,页面置换llAbstractAsadataanalyticalenVir0Imlent,moreandlnoreattemionhasbeenpaidtodatawarehouse,whichisdiVided丘。omtheoperationaldatabaseenviromnent.TheanalyticalenViromentputsfor、Vardhi曲errequnInentsforque巧speedthan

9、operatiomlenviromentwhilecolunm-stores王laVemuchmoreadVantagesthanrow—storesinRead—optimizedandanalyticalenv衲nment.Tothisend,almostoneyearago,theauthorhasahadybegulltheresearchanddeVelopmentofcolumn—ori

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。