基于r和pentaho的全套开源bi平台的实现

基于r和pentaho的全套开源bi平台的实现

ID:20609770

大小:1.70 MB

页数:29页

时间:2018-10-14

基于r和pentaho的全套开源bi平台的实现_第1页
基于r和pentaho的全套开源bi平台的实现_第2页
基于r和pentaho的全套开源bi平台的实现_第3页
基于r和pentaho的全套开源bi平台的实现_第4页
基于r和pentaho的全套开源bi平台的实现_第5页
资源描述:

《基于r和pentaho的全套开源bi平台的实现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于R和pentaho的全套开源BI平台的实现.李舰MangoSolutionsChina目录BI和pentaho套件简介R和pentaho的集成Hadoop下的应用系统选型的建议BI系统的框架业务系统财务系统HR系统Office文件其他格式的数据数据源决策支持功能基础架构数据模型和算法运算引擎财务分析数据挖掘预测仪表盘统计图形OLAP展现动态图形业务应用平台ExtractionETL数据获取和交换平台Transformation展现层Load报表模拟管理报表数据仓库多维分析OLAP引擎Pentaho套件Pentaho架构PentahoBIServer——自由而灵活的平台Rep

2、ortDesigner——方便的报表设计工具Mondrian——强大的开源OLAP引擎SchemaWorkbench——数据仓库的设计WEKA——优秀的数据挖掘平台Pentaho套件的演示目录BI和pentaho套件简介R和pentaho的集成Hadoop下的应用系统选型的建议R包rpentaho的操作演示目录BI和pentaho套件简介R和pentaho的集成Hadoop下的应用系统选型的建议Pentaho对Hadoop的支持http://www.pentaho.com/hadoop/PentahoBusinessAnalyticsPentahoDataIntegration

3、Hadoop简史ApacheNutch2002年,Lucene的子项目。NDFS(NutchDistributedFileSystem)MapReduceMapReduce:大规模集群上的简单数据处理方式(Google)MapReduce+NDFSHadoop2006,命名为Hadoop2008,Apache顶级项目HDFS(HadoopDistributedFileSystem)Hadoop和GoogleGoogle云计算MapReduceBigTableGFSChubbyGFS-->HDFSMapReduce-->Hadoop BigTable-->HBaseHadoop项

4、目结构MapReduce流程HadoopStreamingHadoop的工具,使用脚本文件当mapper或reducer$$HADOOP_HOME/bin/hadoopjar>$HADOOP_HOME/contrib/streaming/hadoop-streaming-*.jar>-input/data/airline/test.dat-output/dept-delay-month>-mappermap.R-reducerreduce.R-filemap.R-filereduce.Rhivehttp://cran.r-project.org/web/packages/

5、hive/index.htmlHadoopInteractiVE(和Hive没什么关系)R和Hadoop的接口提供了存取HDFS的函数对Hadoop进行控制直接在R中运行streamingjobsRhipehttp://www.rhipe.org/基于Hadoopstreaming可以完全在R中开发MapReduce中的Jobs工作在R环境RHadoophttps://github.com/RevolutionAnalytics/RHadoop的开源项目rmrR和Hadoop的Streaming连接器Rhdfs处理HadoopDistributedFileSystemRhbas

6、eR和Hbase的连接器展望Hama(http://wiki.apache.org/hama/)矩阵运算R函数的分布式开发K-Meanslm……目录BI和pentaho套件简介R和pentaho的集成Hadoop下的应用系统选型的建议建议和讨论

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。