infobright- 基于mysql的数据仓库综述

infobright- 基于mysql的数据仓库综述

ID:24561836

大小:50.50 KB

页数:3页

时间:2018-11-14

infobright- 基于mysql的数据仓库综述_第1页
infobright- 基于mysql的数据仓库综述_第2页
infobright- 基于mysql的数据仓库综述_第3页
资源描述:

《infobright- 基于mysql的数据仓库综述》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、infobright:基于mysql的数据仓库综述 一、技术概况  Infobright进行复杂的查询时,通过其专利的知识网格(Knoa支持。支持所有schema设计;  2.行业标准接口。支持标准数据库接口,包括ODBC、JDBC和本地连接;  3.API接口支持支持的API接口包括C、C++、C#、BorlandDelphi(viadbExpress)、Eiffeel、SmallTalk、Java(plementation),Lisp,Perl,PHP,Python,Ruby,REALbasic,F

2、reeBasic,andTcl;  4.DML支持。支持DML语句(Insert、Update、Delete);  5.并发用户数。支持至多500个数据库用户,32个并发查询(视CPU核心数与内存大小而定);  6.操作系统支持。WindoDx86架构服务器(建议16G内存或更多)  3.数据集市(DataMart)  数据集市通常定义为包含特定应用分析的数据仓库,其分析应用与用户的业务紧耦合,具有较强的专业特性,因此通常针对集团内部某个特定的部门建设。在过去几年里,数据集市系统的实施数量快速增长,这种

3、增长是由商业用户快速查询的需求驱动的。  过去数据集市项目由集团的IT部门统一实施,而现在,越来越多的集团内部用户部门自行实施数据集市项目,并由内部IT经理担任实施负责人,以确保数据集市的功能与需求吻合。  四、Infobright几大优点:  1.高压缩比率,平均压缩比可达10:1,甚至可以达到40:1,我用infobright把3.1G的数据存成不足300M。  2.列存储,即使数据量十分巨大,查询速度也很快。用于数据仓库,处理海量数据没一套可不行。  3.不需要建索引,就避免了维护索引及索引随着数

4、据膨胀的问题。把每列数据分块压缩存放,每块有知识网格节点记录块内的统计信息,代替索引,加速搜索。  4.单一台服务器可以高效地读写30T数据。具有可扩展性,这里是指对于同样的查询,当数据量是10T时,它耗费的时间不应该比1T数据量时慢太多,基本是一个数量级内。  与mysql对比:  1.infobright适用于数据仓库场合,即非事务、非实时、非多并发;分析为主;存放既定的事实(基本不会再变),例如日志,或汇总的大量的数据。所以它并不适合于应对来自网站用户的请求。实际上它取一条记录比mysql要慢很多

5、,但它取100ysql快。  2.mysql的总数据文件占用空间通常会比实际数据多,因为它还有索引。infobright的压缩能力很强大,按列按不同类型的数据来压缩。  3.服务形式与接口跟mysql一致,可以用类似mysql的方式启用infobright服务,然后原来连接mysql的应用程序都可以以类似的方式连接与查询infobright。这对熟练mysql者来说是个福音,学习成本基本为0。  infobright有两个发布版:开源的ICE及闭源商用的IEE。ICE提供了足够用的功能,但不能INSER

6、T,DELETE,UPDATE,只能LOADDATAINFILE。IEE除提供更充分的功能外,据说查询速度也要更快。  五、不足之处  不支持数据更新:社区版Infobright只能使用“LOADDATAINFILE”的方式导入数据,不支持INSERT、UPDATE、DELETE  不支持高并发:只能支持10多个并发查询

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。