欢迎来到天天文库
浏览记录
ID:43876113
大小:1.02 MB
页数:44页
时间:2019-10-16
《数据仓库与数据挖掘实验指导》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、ByTMS数据仓库与数据挖掘赠蘭目录第1课:创建SQLserver2005的DT项目和基本包31.1仓U建新白勺IntegnHionServices项目51.2添加和配置平面文件连接管理器61.3添加和配置OLEDB连接管理器81.4在包屮添加数据流任务81.5添加并配置平面文件源91.6添加并配置查找转换91.7添加和配置OLEDB目标101.8测试Lesson1教程包11第2课:添加循环122.1创建Lesson2包132.2添加和配置Foreach循环容器13一、添加Foreach循环容器13三、将枚举器映射为用户定义的变量14四、将数据流任务添加到循环中142.3修改平面文件连
2、接管理器142.4测试Lesson2教程包15第3课:在AnalysisServices项目中定义数据源视图及多维数据集16—、创建AnalysisServices项目16二、定义新的数据源18三、定义数据源视图22四、修改表的默认名称25五、定义多维数据集27五、检查多维数据集和维度属性32六、咅曙AnalysisServices项目40第1课:创建SQLserver2005的DT项目和基本包在本课中,您将创建一个简单ETL包,该包可以从单个平面文件源提取数据,使用两个查找转换组件转换该数据,然后将该数据写入AdventureWorksDW小的FactCurrencyRate事实数据
3、表。在本课中,您还将学习如何创建新包、添加和配置数据源和目标连接以及使用新的控制流和数据流组件。重要事项:木教程需要AdventureWorksDW示例数据库。有关安装和部署AdventureWorksDW的详细信息,请参阅:了解包要求在创建包之前,需要充分了解在源数据和目标数据中使用的格式。了解了这些数据格式后,便可定义将源数据映射到目标数据所需的转换。查看源对于本教程,源数据是平面文件SampleCurrencyData.txt中包含的一组历史货币数据。源数据包括以下四列:平均汇率、货币键、日期键和当天汇率。下面是SampleCurrencyData.txt文件中所包含的源数据示例
4、:1.00010001ARS9/3/20010:000.999600161.00010001ARS9/4/20010:001.0010010011.000200()4ARS9/5/20010:000.999900011.00020004ARS9/6/20010:001.000400161.00050025ARS9/7/20010:000.999900011.00050025ARS9/8/20010:001.0010010011.00050025ARS9/9/20010:0011.00010001ARS9/10/20010:001.000400161.00020004ARS9/11/20
5、010:000.999900011.00020004ARS9/12/20010:001.001101211在使用平面文件源数据时,需要了解平面文件连接管理器如何解释平面文件数据,这一点很重要。如果平面文件源是Unicode编码的,则平而文件连接管理将所有列定义为[DT.WSTR],默认列宽为50。如果平面文件源是ANSI编码的,则将列定义为[DT_STR],默认列宽为50。您可能必须更改这些默认设置,才能使字符串列类型与所使用的数据更相符。为此,您需要查看将写入数据的目标的数据类型,然后在平面文件连接管理器中选择正确的类型。查看目标源数据的最终目标是AdventureWorksDW中的
6、FactCurrencyRate事实数据表。FactCurrencyRate事实数据表有四列,并且与两个维度表有关系,如下表所示。列名称数据类型查找表查找列AverageRatefloat无无CurrencyKeyint(FK)DimCurrencyCurrencyKey(PK)TimeKeyInt(FK)DimTimeTimeKey(PK)EndOfDayRatefloat无无将源数据映射为与目标兼容对源数据和目标数据的分析指出需要查找CurrencyKey和TimeKey值。将执行这些查找的转换通过使用DimCurrency和DimTime维度表中的备用键来获取CurrencyKe
7、y和TimeKey值。平面表名列名称数据类型文件0FactCurrencyRateAverageRateFloat1DimCurrencyCurrencyAlternateKeynchar(3)2DimTimeFullDateAlternateKeyDatetime3FactCurrencyRateEndOfDayRateFloat本课程包含以下任务:•创建新的IntegrationServices项目•添加和配置平面文件连接管理器・添加和配置
此文档下载收益归作者所有