欢迎来到天天文库
浏览记录
ID:40222474
大小:90.00 KB
页数:39页
时间:2019-07-27
《资料仓储与资料探勘》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、資料倉儲與資料探勘資料倉儲之介紹資料倉儲的目的是希望藉由整合公司內部的資料並綜合各種外部資料,進而對公司重要決策者提供一個整體的、廣泛的訊息認知、以供完成一策略性的決策根據MetaGroup在1993年的調查,僅有5%的公司對資料倉儲有興趣。到了1994年已上升至90%,可見未來幾年資料倉儲是一極為重要的成長領域資料倉儲之介紹(續)根據MetaGroup的調查,資料倉儲的軟體硬體服務與市場規模將由1996年的20億美金成長到2000年的120億美金,使得如IBM、Oracle等知名大廠紛紛投入此一領域根據I
2、DC在1996年對62家公司所作的研究顯示,資料倉儲的投資報酬率最高可達到600%,且有一半財務利益來自於決策的制定,顯示資料倉儲確實可以支援組織的決策之制定資料倉儲之定義資料倉儲之父BillInmon認為資料倉儲為決策支援系統的核心BillInmon和ChuckKelley認為資料倉儲不僅為資料庫、且具有下列特性:整合性:包含應用程式、資料庫、電腦系統主題導向:回答組織特定問題時間變數:隨時間變化的動態資料非變動性:資料倉儲之定義(續)JohnvandenHoven認為資料倉儲是經改良過的決策支援系統,可
3、產生高階的(high-level)、整合的(Integrated)、系統化的(organized)、結構化的(structured)資料以應用於協助商業決策綜上所述,資料倉儲是經由建立集合式的資料倉庫,從多個分散的資料來源中蒐集資料,配合分析工具,支援決策者的決策制定資料倉儲之特性傳統資料庫著重於單一時間之單一資料處理(onerecordatatime)、偏重於擷取詳細之資料以供參考、注意資料檔的構成及資料正規化(normalization),且使用者多為中階經理人員資料倉儲注重某一段時間內之綜合資料(su
4、mmarydataonagiventimeperiod)、注重大批資料提供之走向趨勢、注重資料本身所內涵之意義及訊息,且使用者為決策支援系統和高階主管資訊系統的使用者資料倉儲之技術資料儲存(DataStore)現在資料倉儲中之資料儲存可稱為作業型資料儲存(OperationalDataStore),一種儲存機制依資料時效性區分,可將資料區分為即時的(Real-time)、接近即時的(NearReal-time)、與某時點(Point-in-time)的資料一般資料倉儲儲存都是歷史資料,可稱為時點性的資料(P
5、oint-in-timedata),其應用範圍包括簡單的查詢到複雜的資料提煉等資料倉儲之技術(續)資料提煉(DataMining)資料提煉是屬於發現導向(discovery-basedapproach)方式,從不同資料來源蒐集大量資料,經過詳確的分析後,提供有價值的資訊給使用者,一般用於行銷決策上。資料提煉常可發掘出超越歸納範圍的關係,與傳統OLAP(On-LineAnalyticalProcessing)大不相同,可用於個人化行銷。資料倉儲之優缺點優點有形的優點可整合企業各部門的資料及減少作業成本企業內部
6、文件趨向單一規格化,便於儲存與查閱。此一企業內文件規格之整合乃是一極大優勢資料倉儲之優缺點(續)無形的優點資料來源可由各部門取得,充分運用組織資源確保日常作業不受干擾提升企業的效率與生產力可充分運用組織所掌控的資訊來獲競爭優勢資料倉儲之優缺點(續)提供更快的資訊以增強加速決策的品質提供即時有效的資訊資料可信賴度高使用者可經由單一查詢介面獲得所需資訊可從倉儲的歷史資料中預測未來趨勢與結果資料倉儲之優缺點(續)缺點資料倉儲的開發往往為一極大的投資,風險性高資料倉儲的開發相當費時若是軟硬體規格不一,將會有無法跨平
7、台存取資料的問題倉儲中龐大的歷史資料的管理問題-需用彙總資料(metadata)技術加以管理資料更新的問題-可採非同步方式更新資料倉儲之發展架構由於資料倉儲為一高投資、高風險、需求不定且開發費時的一項工程,所以需要做長期的規劃,應採雛型法(Prototyping)開發。開發過程主要分為四個階段,分別是:資料收集系統分析系統設計系統維護資料倉儲之發展架構-資料收集資料收集資料收集的主要目的在於定義企業需求。必須先成立工作小組或指導委員會(steeringcommittee),系統開發的工作交由工作小組負責,而
8、指導委員會扮演監督、控制與管理的角色。企業目標訂定,並研擬達成這些目標所需的決策過程及所需資料。此階段另一重要的工作為了解使用者的需求,需產出需求定義規格書,內容詳細記錄使用者的需求。資料倉儲之發展架構-系統分析系統分析此階段的參與者以負責開發系統的工作小組為主,根據前一階段所產生的需求定義規格書,並進一步分析規格書內所紀錄的使用者需求。資料倉儲之發展架構-系統分析在此階段中,可評估系統的五個可行性:技術可行性(
此文档下载收益归作者所有