欢迎来到天天文库
浏览记录
ID:37271179
大小:476.50 KB
页数:18页
时间:2019-05-20
《资料库系统专题课程》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、資料庫系統專題課程期末報告線上分析處理(On-LineAnalyticalProcessing,OLAP)李建祥D954020001,張珀銀D954020007一、導論線上分析處理(On-lineAnalyticalProcessing,後文簡稱OLAP)是一種多維度資料分析的方法。從企業決策的角度來看,常需要從日常的交易資料中,了解銷售量或金額多寡,作為製造或促銷的決策依據。而銷售結果需要從各種角度加以分析,才能看出有變異或趨勢,進而理出有助於決策的有用資訊。以汽車銷售為例,我們想要了解汽車的銷售情形,首先
2、,以時間維度分析各年度的汽車銷售量,從圖一來看,從1990到1992年,各年度的汽車銷售量很穩定都是69輛。圖一:以時間維度分析各年度的汽車銷售量從時間維度來看汽車銷售量似乎沒有差異,此時,銷售經理可能想進一步了解,不同車型是否仍然有相同的銷售量。於是,加上一個車型維度,進一步交叉分析銷售量的變化,其結果如圖二所示。從圖中,我們可以看到,Chevy車型的銷售量呈現逐年遞增的現象;反之,Ford則表現出逐年遞減的趨勢。圖二:以時間和車型等二維度分析汽車銷售量加上車型維度的分析所表現出的銷售量異常現象,可能給予銷
3、售經理一個新的思考方向,為何Ford銷售會降低而Chevy銷售量會提升?是否要採取一些促銷策略來提昇Ford車型銷售?哪些促銷對象較適當?對於這些問題,銷售經理可能會再加入一個客戶維度,來分析這些歷史銷售的客戶年齡層,以作為擬定促銷對象的參考,或針對車型進一步分析客戶對顏色的偏好,如圖三所示,不論是Chevy或Ford客戶似乎較喜愛購買白色車子。圖三:針對車型維度進一步分析顏色子維度在各年度的銷售量從上述的簡單例子來看,企業決策者在分析問題的過程中,常需要以不同的維度分析資料,以發掘出有意義的資訊,而且多個維
4、度的交叉分析,或進一步分析某個維度的子維度的資料變化情形,也是在發現異常現象時,所採取的分析方式。雖然,這些分析所需的資訊,可以透過報表系統來呈現,但報表的產生需要固定的格式,無法迎合決策者視問題內容,隨時變換分析維度的需求;且這些資訊可能牽涉上百萬筆交易記錄的讀取與彙總,整理資料所需的空間耗用與時間耗費,不是報表系統在合理的反應時間內所能提供的。為此,要滿足多維度的彈性與大量資料的彙總等分析需求,目前主要資料庫管理系統和ERP大廠,如:甲骨文(Oracle)、微軟(Mircrosoft)、和思愛普(SAP)
5、等公司,也都提供了OLAP解決方案,協助其企業客戶解決大量資料分析的問題。為說明OLAP相關的概念與實作方式,本報告的章節組織如下:首先我們將介紹OLAP功能特色,闡述OLAP為滿足企業大量資料分析需求,所提供的獨特功能;接著,介紹描述OLAP產物─資料立方體(datacube,後文簡稱cube)的維度模式,以及如何將關連資料庫的實體關係模式轉化成維度模式的步驟;另外,也將介紹資料庫儲存cube的常用方法,並比較其優劣;最後,介紹一種能存取cube的語言─Multi-DimensionalExpression
6、,簡稱MDX),說明除了透過圖形化的使用者操作介面外,如何使用查詢語言存取cube上的資料。一、功能特色根據Thomsen的歸納,OLAP具有以下的功能特色(Thomsen,2002):l含階層式的多維度結構:提供多維度的分析是OLAP最主要的特色,而且任一個維度也可以包含多個層級的子維度,而成為階層式的結構關係,如圖四所示。圖中的量值(measure)表示分析所需的彙總欄位,如銷售量,而維度包含多個層級,而每個層級必須從屬於其父層級或維度。層級只是是抽象概念,其實體內容稱為成員(member)。以時間維度為
7、例,它底下有「年」,而「年」底下可在分成「季」,「季」包含「月」,「月」包含「日」,所以時間維度可形成年、季、月、日等四個階層維度,其結構如圖五所示,而「年」的成員如:2001、2002、...等等。圖四:階層式的維度結構圖五:以時間維度為例的維度層級l有效的交叉比較與分析規格:多維度的分析除了能以各種不同維度彙總交易資料中的某些欄位(如:第一節的汽車銷售量)外,也能提供多個維度交叉比對的結果,就如同第一節描述的以時間和車型等二維度,交叉分析汽車銷售量,可呈現如表一的分析結果。另一種狀況是,分析的資料可能不是
8、來自於單個來源資料欄位的彙總,而是要合併多個維度的成員之彙總資料,計算而得的資訊,例如:銷售成長率,必須將時間維度中各年度成員的銷售量與前一年度成員的銷售量相除,以得到如表二所示的成長率。OLAP能透過定義量值的計算屬性,得到類似成長率的推導量值(derivedmeasure)。表一:以時間和車型等維度的汽車銷售量交叉分析199119921993合計Chevy304048118Ford3929218
此文档下载收益归作者所有