资源描述:
《kettle调研手记-技巧汇总.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、1、对于源数据后面自动添加“.0”的问题可以通过在输入步骤“格式”栏中设置长度解决,如下图2、输入为excel文件时的设置说明1.文件选择一个Excel文件或保存有Excel文件的目录。文件或目录:设置要读取的Excel文件的名称,或一个目录。可以使用【浏览】按钮来选择文件或目录。正则表达式:设置一个正则表达式来匹配一个目录下的部分Excel文件。选择的文件:列出所有选中的文件,可以使用【增加】按钮将【文件或目录】中的文件添加到文件列表中。2.工作表选择工作薄中的一个或多个工作表,并通过指定工作表中的开始行号和开始列号来设要读取的内容。工作表名称:设置
2、要读取的工作表的名称,可以通过【获取工作表名称】按钮来获取Excel工作薄中的所有工作表。起始行:设置工作表中数据的开始行号(从0开始)起始列:设置工作表中数据的开始列号(从0开始)3.内容内容中包含列名:如果内容中第一行是列名,则选中该选项。列名所占行数:如果内容中第一行是列名,该选项可以设置列名一共占据几行。在列名比较长的情况下,列名可能会占据工作表的多行。输出中不包括空行:在输出中不包括空行。遇到空行停止读取:在读取工作表内容的过程中如果遇到了空数据行则读取结束。文件名称字段:在输出中增加一个字段来保存读取的Excel文件名。工作表名称字段:在输
3、出中增加一个字段来保存读取的Excel工作表名。行号字段:在输出中增加一个字段来保存读取的Excel工作表中的每一行的行号,行号是在工作表中的实际行号。行数限制:读取的最大行数,0代表所有行。4.错误处理严格类型检查:如果选中该选项,当读取到的列数据类型和指定的列数据类型不一致时则读取失败.否则会进行数据类型的转换,如果转换失败则产生错误行(行中的一个或多个数据读取失败)。忽略错误:如果选中该选项,当读取数据行发生错误行时,则忽略发生的错误行。跳过错误行:如果选中该选项,将跳过发生错误的行。否则读取错误的数据将置为空值。警告文件保存目录:设置警告信息保
4、存目录,用于保存在读取数据过程中发生的警告。错误文件保存目录:设置错误信息保存目录,用于保存在读取数据过程中发生的错误。错误行号保存目录:设置错误行号保存目录,用于保存在读取数据过程中发生错误行的行号。5.字段显示并设置从Excel工作表中读取到的所有字段,包括名称,类型,精度,刻度,转换掩码等信息。名称:列出要读取的字段名,用户可以通过【获取字段名称】按钮获得所有字段名。类型:指定字段的期望数据类型,如果和实际数据类型不符,可能在读取时会产生错误。长度:该字段的长度。精度:该字段的精度(对于Number类型)。去除空格:去除空格的几种方式(不去除、左
5、去除、右去除、全部去除)小数:小数点符号可以是"."(10;000.00)或","(5.000,00)分组:数字的分组符号可以是","(10,000.00)或"."(5.000,00)Nullif:如果是Null时设置为其他值.重复:如果是Null时重复上一个非空的值.格式:设置数据格式,一般用于数据转换的情况。Excel工作表中的数据,都有特定的数据类型,因此在读取数据时,需要为每个字段设置和实际相符的正确的数据类型。如果没有设置数据类型,则所有的数据都以字符串方式来读取,此时不同类型的数据转换为字符串时,会有不同的转换方式。以数值类型转换为字符串类
6、型为例:格式表达式格式描述###,###,###.#######每三位使用逗号分割的数字(默认方式)#####.###############%数字后面添加百分号#取整数(四舍五入)0000000000十位整数,不足十位前面补0000.00小数点前最少三位,不足前面补零,小数点后最少两位,不足后面补01、根据入库单号把明细中的金额求和后,更新到主表中,但是如果有的入库单号在主表中不存在则就会报错,这是数据问题,解决办法为,在更新步骤中设置一下”忽略查询失败”,则只对目标表中存在数据进行更新,如下图:2、使用资源库(repository)登录时,默认的用
7、户名和密码是admin/admin3、当job是存放在资源库(一般资源库都使用数据库)中时,使用Kitchen.bat执行job时,需使用如下的命令行:Kitchen.bat/reprepository_name/useradmin/passadmin/jobjob名称>E:\test.log其中repository_nameo为repository.xml中的repository,在最下面1、当job没有存放在资源库而存放在文件系统时,使用Kitchen.bat执行job时,需使用如下的命令行:Kitchen.bat/norep/fileuser-
8、transfer-job.kjb2、资源名称最好不要用中文,如果程序在保持时的字符集跟系统不一