资源描述:
《数据库转换工具的设计与实现-毕业设计论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、本科生毕业设计[论文](题目)数据库转换工具的设计与实现院系____计__算__机__科__学__与__技__术_____专业班级_______________________姓名_______________________学号_______________________指导教师_______________________年月日华中科技大学毕业设计(论文)摘要本文设计与实现了一个数据库的数据转换工具,能够实现多数据源间的数据的导入导出和数据整合。该工具基于开源ETL工具Kettle,使用纯java语言编写,可用于二次开发。而数据转换工具的设计是在kettle的
2、源码基础上,进行功能的扩展。数据库转换工具是在kettle的数据抽取、数据转换、数据加载三个方面的插件功能上进行了添加,从通用的数据库连接方式中分离出了DM数据库的连接,实现达梦数据库和oracle数据库之间的数据转换。总共增加的步骤插件有7个。数据抽取:word输入,word文件作为数据源,兼容doc和docx格式的文件。数据以表格形式存储在word文件中,Word输入是从一个word文件的表格中抽取数据;数据加载:word输出,生成一个docx格式的文件,数据存储在word文件的表格中;数据清洗:单位换算,支持长度、重量、频率、速度、功率及角度这6种单位的换算;
3、字段清理,可根据设置的分隔符字符和位置清理掉其前或其后的字符串;提取数字,仅保留字符串中带符号的数字;全半角转换,将字符串中全角符号全部转换为半角符号;日期规格化,将不合法的日期规格化。关键字:kettle,元数据,插件,数据转换,数据清洗,word输入输出I华中科技大学毕业设计(论文)AbstractThemainpurposeofthispaperistodesignandimplementadatatransformationtooltoachievedataimportandexportfrommultiplesourcesanddataintegratio
4、n.KettleisanopensourceETLtool,usingpurejavalanguage,whosesourcecodeisabletoberedeveloped.Thetoolisbasedonkettle’ssourcecodetoaddfunctionextensionsintransformationpart.Kettleisanapplicationthatconsistsofaplatformandpluginstructure.Inthistopic,themodificationofkettleisinpluginstructure.W
5、emainlyaddthefunctionaboutdataextraction,datatransformationanddataloading,aswellasseparatingtheDMdatabaseconnectionfromthegeneraldatabaseconnection.Totally,sevenstepsofpluginareadded,includingwordinputindataextraction,thatwordfilesisregardedasadatasource.Dataisstoredintable.Dataextract
6、ingfromatableinwordfiles.Wordfilessupportsdocanddocxformat.,wordoutputindataloadingwhichgeneratesawordwhoseextensionisdocx.Dataisstoredintable.andindatatransformation,includingunitconversionthatsupports6unitsconversionwhichincludinglength,quality,speed,frequency,powerandangle;fieldclea
7、ning,astringthatcanbecleanedbeforeorafteraccordingtothesettingoftheseparatorstring;extractionofdigital,Onlythenumberwithsigncanbereservedinastring;full-to-half,llfullwidthsymbolswillbeintohalfwidthsymbols;DateStandard,itstandardizesillegaldatestring.KeyWords:kettle,metadata,plugin,da