欢迎来到天天文库
浏览记录
ID:48027346
大小:1.47 MB
页数:53页
时间:2020-01-11
《informatica组件介绍.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、主讲人:黄祝康日期:2014-2-281Informatica基础开发目录1.客户端简介2.ETL抽取前准备3.ETL任务设计步骤4.简单实例演示233Powcenter-组件总体介绍数据抽取组件1、SourceQualifier:数据源编辑组件2、文本文件导入3、XML文件导入4、JOIN组件:关联组件数据转换组件1、Normalizer:行转换列组件2、Expression组件:表达式组件3、Aggregator组件:聚合组件4、Filter组件:过滤组件5、Router组件:路由组件6、Sorter组件:排序组件44Powcenter-
2、组件总体介绍数据转换组件7、Union组件:联合组件8、Lookup组件:查找组件9、StoredProcedure组件:调用存储过程组件10、SequenceGenerator组件:生成序列号组件11、Input/Output组件:输入/输出组件数据装载组件1、UpdateStrategy组件:插入/更新/删除/拒绝组件55数据抽取组件-SourceQualifier(一)功能:根据查询SQL从关系表或文本文件查出所要记录;特点:1、每个数据源后面都会带一个SourceQualifier组件;关系表源文本文件源SourceQualifier
3、组件SourceQualifier组件66数据抽取组件-SourceQualifier(二)2、连接同构的源数据,可以连接多个表;异构数据源,需要使用JOIN组件;SourceQualifier组件77数据抽取组件-SourceQualifier(三)3、定制SELECT语句来读取源数据,去除重复记录、增加过滤条件、关联条件等;88数据抽取组件-SourceQualifier(四)4、可以在执行数据抽取之前(PreSQL)或者执行数据抽取(PostSQL)之后对数据进行处理(可以调用SQL脚本、调用存储过程);PreSQLPostSQL99数
4、据抽取组件-文本文件导入(一)功能:文本文件源数据导入特点:1、选择Source->ImportfromFile导入文本文件源数据的数据结构,分隔符可以自己定义;定义分隔符1010数据抽取组件-文本文件导入(二)2、指定文本文件所在的目录,可预览数据;1111数据抽取组件-文本文件导入(三)3、不支持Excel数据导入,Excel文件要另存为扩展名为csv的文件才可以导入;1212数据抽取组件-XML源文件导入功能:XML源数据导入特点:1、选择Source->ImportXMLDefinition导入XML源数据的数据结构;2、在Sessi
5、on指定XML文件所在的目录;XML源文件1313数据抽取组件-Joiner(一)功能:实现同构或者异构源数据关联;特点:1、一次只能关联2个源数据,如果是N个源数据,就要N-1个Joiner进行关联;2、文本文件和关系表源数据关联、不同数据库的关系表源数据关联;3、对数据进行排序再进行关联;1414数据抽取组件-Joiner(二)4、可以指定关联类型,关联类型有NormalJoin、MasterOuterJoinDetail、DetailOuterJoin、FullOuterJoin4种;指定关联类型1515数据转换组件-Normalize
6、r(一)功能:行转换成列;特点:1、只能实现行转列,如果要实现列转换成行(要用SourceQualifier组件定制SELECT实现);1616数据转换组件-Normalizer(二)2、在NormalizerTAB里面进行设置Occurs;表示记录出现的次数1717数据转换组件-Expression组件(一)功能:执行非汇总的计算特点:1、在Port中“I(表示Input输入)”“O(表示Output输入)”“V(表示Variable变量)”,如果“O”打勾并在Expression中设置默认值表示设置常量;设置常量1818数据转换组件-Ex
7、pression组件(二)2、可以设置局部变量,变量在该mapping中有效,“V(表示变量)”端口打勾,并设置变量表达式;设置变量表达式1919数据转换组件-Expression组件3、在表达式编辑器中可以编写类SQL脚本,如IIF、DECODE、SUBSTR等、可以校验表达式是否准确;校验表达式2020数据转换组件-Aggregator组件(一)功能:汇总计算特点:1、求平均值AVG、求和SUM、最大值MAX、最小值MIX、统计COUNT等;Aggregator组件2121数据转换组件-Aggregator组件(二)2、跟SQL的grou
8、pby区别,SQL里面除了不进行汇总计算的字段都要跟在groupby后面,但该组件只要求选择分组的字段。双击agg_CALC_PROFIT_and_MARGIN组件
此文档下载收益归作者所有