欢迎来到天天文库
浏览记录
ID:20840271
大小:13.07 MB
页数:142页
时间:2018-10-17
《史上最强 Kettle 培训教程.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、Kettle工具使用培训教程目录ETL简介KETTLE简介KETTLE安装和运行KETTLE菜单简介KETTLE案例讲解控件介绍日志介绍一、ETL简介ETL概念简介ETL相关的质量特性ETL在数据仓库项目中的位置二、kettle工具简介Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定Kettle中有两种脚本文件,transformation(转换)和job(作业),transformation完成针对数据的基础转换,job则完成整个工作流的控制。Kettle工具的模型架构kettle工具的优缺点
2、优点:缺点•系统开源、免费•稳定性差•安装方便、图形化安装•性能差•支持多种数据源•缺乏元数据管理•支持多种字符集•具有简单的权限管理•支持各种复杂数据转换KETTLE的下载Kettle可以在http://kettle.pentaho.org/网站下载下载kettle压缩包,因kettle为绿色软件,解压缩到任意本地路径即可Kettle运行步骤双击运行kettle文件夹下的Kettle文件,出现kettle欢迎界面。创建资料库(可省略)创建数据库连接创建转换创建Jobs,进行流程化控制KETTLE的使用进入到Kettle目录,如果Kettle部署在w
3、indows环境下,双击运行spoon.bat文件,出现如下界面:Kettle使用步骤(1)创建转换大概的来说一般由三步组成:输入+转换等中间步骤+输出(2)创建作业将已经创建好的转换和相关的作业组件串联起来,形成一个整体的任务。Kettle的执行顺序•作业:分串行执行和并行执行,串行执行是先执行完其中一条线再执行另一条线,并行是两条线同时执行,同一条线上的两个步聚会先执行前面的再执行后面的。每个步骤执行结果分两种:true(成功)/false(失败),根据返回结果可以控制流程走向。转换:一开始所有步骤同时运行,记录会从最前端的步骤向后传递,传递到相应步骤则该记录
4、被该步骤作相应处理,处理完成再把记录往后传递,记录传递分复制和分发两种模式。KETTLE的目录介绍ↂ根目录文件夹介绍:【Docs】存放Kettle各种语言版本的API文档。【Launcher】存放KettleSpoon加载的一些配置信息。【Lib】存放Kettle所使用到的第三方jar包。比如:数据库驱动包,如缺少时需要把对应的数据库驱动包放入此文件夹中。【Libswt】存放Kettle对应不同平台的相关UIjar包。【Plugins】存放Kettle自定义插件时,需要把自定义好的插件打成jar放在此目录。【Pwd】存放Kettle配置集群时所需要的配置文件与加密文
5、件。【Samples】存放Kettle自带的一些Job与Trans实例。【Simple-jndi】存放Kettle使用JNDI方式连接数据源方式的文件存放目录。目录下的jdbc.properties配置文件中有相应的实例提供参考。【Ui】存放Kettle初始化使用到的图片及配置信息。Kettle菜单介绍-transformation转换的菜单介绍:MainTree菜单列出的是一个transformation中基本的属性,可以通过各个节点来查看。DB连接:显示当前transformation中的数据库连接,每一个transformation的数据库连接都需要单独配置
6、。Steps:一个transformation中应用到的环节列表Hops:一个transformation中应用到的节点连接列表Kettle菜单介绍-transformation转换的菜单介绍:CoreObjects菜单列出的是transformation中可以调用的环节列表,可以通过鼠标拖动的方式对环节进行添加。Input:输入环节Output:输出环节Lookup:查询环节Transform:转化环节Joins:连接环节Scripting:脚本环节Kettle菜单介绍-transformation每一个环节可以通过鼠标拖动来将环节添加到主窗口中。并可通过s
7、hift+鼠标拖动,实现环节之间的连接。Kettle菜单介绍-transformation转换的常用环节介绍:Kettle菜单介绍-job作业的菜单介绍:MainTree菜单列出的是一个Job中基本的属性,可以通过各个节点来查看。DB连接:显示当前Job中的数据库连接,每一个Job的数据库连接都需要单独配置。Jobentries:一个Job中引用的环节列表Kettle菜单介绍-job作业的菜单介绍:Jobentries菜单列出的是Job中可以调用的环节列表,可以通过鼠标拖动的方式对环节进行添加。每一个环节可以通过鼠标拖动来将环节添加到主窗口中。并可通
此文档下载收益归作者所有