KETTLE组件介绍与使用

KETTLE组件介绍与使用

ID:40415913

大小:2.16 MB

页数:25页

时间:2019-08-02

KETTLE组件介绍与使用_第1页
KETTLE组件介绍与使用_第2页
KETTLE组件介绍与使用_第3页
KETTLE组件介绍与使用_第4页
KETTLE组件介绍与使用_第5页
资源描述:

《KETTLE组件介绍与使用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、KETTLE组件介绍与使用4.1Kettle使用Kettle提供了资源库的方式来整合所有的工作,;1)创建一个新的transformation,点击保存到本地路径,例如保存到D:/etltest下,保存文件名为Trans,kettle默认transformation文件保存后后缀名为ktr;2)创建一个新的job,点击保存到本地路径,例如保存到D:/etltest下,保存文件名为Job,kettle默认job文件保存后后缀名为kjb;4.2组件树介绍4.2.1Transformation的主对象树和核心对象分别如下图:

2、Transformation中的节点介绍如下:MainTree:菜单列出的是一个transformation中基本的属性,可以通过各个节点来查看。DB连接:显示当前transformation中的数据库连接,每一个transformation的数据库连接都需要单独配置。Steps:一个transformation中应用到的环节列表Hops:一个transformation中应用到的节点连接列表核心对象菜单列出的是transformation中可以调用的环节列表,可以通过鼠标拖动的方式对环节进行添加:Input:输入环节

3、Output:输出环节Lookup:查询环节Transform:转化环节Joins:连接环节Scripting:脚本环节4.2.2Job的主对象树和核心对象分别如下图:MainTree菜单列出的是一个Job中基本的属性,可以通过各个节点来查看。DB连接:显示当前Job中的数据库连接,每一个Job的数据库连接都需要单独配置。Jobentries/作业项目:一个Job中引用的环节列表核心对象菜单列出的是Job中可以调用的环节列表,可以通过鼠标拖动的方式对环节进行添加。每一个环节可以通过鼠标拖动来将环节添加到主窗口中。并可通

4、过shift+鼠标拖动,实现环节之间的连接。4.3使用举例14.3.1建立转换选中列表中的的“表输入”、“表输出”、“插入/更新”,拖拽到右侧工作区。鼠标选中节点键盘按shift键,拖拽即可连线。下图是一个转换,有两个动作,一是直接从数据源表同步数据到目标表,一是检查源表的插入和更新,同步到目标表。黑色线为生效,灰色线为失效,节点和连接可双击进行编辑。可预览数据是否正确。双击编辑表输出动作。操作的数据库名要获取的字段设置如下所示:点击“Enterfieldmapping/输入字段映射”进行字段选择。选择要用的字段后点确

5、定,注意字段的约束条件。编辑好后点击上面的执行即可。左侧参数暂不说明,执行完成后可以观看下方的日志。双击编辑“插入/更新”动作。然后点击运行。执行前,在源库里加条新纪录。确定作业执行正常后可以保存作业,如保存路径到本地磁盘地址C:etl2.ktr。4.3.2建立执行的JOB/作业建立JOB的前提是有可以完整执行的作业,上面步骤定制的作业进行保存。从左侧列表拖拽“START”,“Success”,“转换”,“发送邮件”到工作区并连接,如下图。然后双击“START”动作进行编辑。然后双击编辑“Transformation

6、”活动。转换文件名选择上一步编辑好的.ktr文件双击发送邮件,参数设置如下:编辑完成后直接点击运行即可。运行后查看日志。当任务执行以后可以查看相对应的日志,也可自行配置日志。4.4使用举例2本例是完成读取目录下的.log文件,找出其中包含错误代码的行,并统计个数4.4.1新建Transformation本例所用到的步骤和组件如下图所示:连接图如下所示:a)获取文件名设置如下:其中已选择的文件名称的变量都需要手写输入,可以点击显示文件名和预览记录检查是否配置正确。b)文本文件输入设置如下:文本文件输入选项中选择从上一步骤

7、获取文件名,其中在输入里的字段被当做文件名一栏输入uri,步骤读取的文件名来自填写获取文件名2内容选项卡的设置如下:文件类型选择CSV,分隔符自己定义,格式为mixed,编码方式选择UTF-8字段选项可设置如下:需要手写输入str名称,设置类型为Stringc)获取字符串设置如下:d)测试脚本设置如下其中可以点击获取变量和测试脚本来测试脚本的正确性点击测试脚本界面如下:脚本代码由JavaScript编写e)聚合记录聚合记录就是将上一步的结果进行聚合,这里的名称字段是点击获取字段获取的,而不是自己输入的,newname一

8、列是制定新名字,可以自己输入填写,f)文本文件输出文本文件的输出设置如下,其中字段属性的设置名称字段是点击获取字段自动获取的,不是输入的,设置如下g)运行日志显示如下:4.4.2建立JobJob的建立于4.3中方法一样,用到的组件如下所示转换组件设置如下:将上一步保存的*.ktr添加到转换名文件路径中点击运行按钮:生成日志如下所示

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。