欢迎来到天天文库
浏览记录
ID:15003763
大小:187.50 KB
页数:22页
时间:2018-07-31
《fall资管所资料库系统专题》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2007Fall資管所資料庫系統專題FinalProjectDBMSsupportoftheDataMiningAdvisor:黃三益博士Student:D954020005楊宗憲D954020006王士豪二○○八年一月二十三日目錄2007Fall資管所資料庫系統專題FinalProject11DataMining簡介51.1DataMining之定義51.2DataMining進行的程序61.3為何使用DataMining82DataMining之相關演算法與功能102.1支援DM之演算法介紹102.2DM之主要用途103DataMiningSQL查詢語法133.
2、1關聯法則探勘的幾種方案133.1.1MSQL143.1.2DMQL153.1.3OLEDBforDM154OLEDBforDM查詢語法實作技術175結論196感想216.1by宗憲216.2by士豪22圖目錄圖1DataMining之前置步驟6圖2資料採礦進行的步驟7圖3建立DMmodel16圖4DataMining在企業中之角色19表目錄表1DM之應用軟體與工具9表2不同演算法對於不同用途之支援121DataMining簡介DataMining常有人稱之為「資料採礦」或「資料探勘」。顧名思義,就是在一大群資料(礦坑)中,找到我們所需要的資訊(礦)。更嚴謹地說,D
3、ataMining是幫助我們在一大群資料中找出pattern,賦予原本雜亂無章的資料意義,進而從中歸納出理論,而這些理論必須要有助於我們解決問題,當pattern成為知識後將創造出更大的價值,目前有商業上很多的DBMS除了基本的資料庫管理之外,也紛紛添加了資料探勘的功能在其中,此外學術中更不乏有許多新的演算法提出,藉以改善資料探勘之效能,以下第一章將先針對DataMining作一初步之簡介。1.1DataMining之定義資料探勘所指的是在一個確定資料中有效的,可能有用的,並且最終能被理解使用的模式,資料採礦的過程是為要發現出有意義的樣型或規則,而必須從大量資料之中
4、以自動或是半自動的方式來探索和分析Data。資料探勘也是一種新的且不斷循環的決策支援分析過程,它能夠從組合在一起的資料中,發現出隱藏價值的知識,以提供給企業專業人員參考基本上,DataMining就是一種可以用來將你的資料中隱藏的資訊挖掘出來的技術,所以DataMining其實是所謂的KnowledgeDiscovery的一部份,因此有些人也稱之為KDD(KnowledgeDiscoveryinData),此外知識探勘、知識挖掘、知識萃取甚至是企業智慧(BusinessIntelligence)也是常見之說法。DataMining使用了許多統計分析與Modeling
5、的方法,在資料中尋找有用的特徵(Patterns)以及關連性(Relationships)。KnowledgeDiscovery的過程對DataMining的應用成功與否有重要的影響,只有它才能確保DataMining能獲得有意義的結果。1.1DataMining進行的程序DataMiming的應用程式與工具是利用資料來建立一些模擬真實世界的模式(Model),利用這些模式來描述資料中的特徵(Patterns)以及關係(Relations)。這些模式有兩種用處,第一,瞭解資料的特徵與關係可以提供你做決策所需要的資訊。第二,資料的特徵可以幫助你做預測。一開始時,我們並
6、沒有任何的Model,等到資料輸入後,經過DataMining工具的運算與訓練,建立出一個依據訓練資料模擬真實世界的Model,有了這一個Model後,再將需要進行預測的資料輸入測試,依據這一個Model,以DataMining工具加以評估,預測出一筆資料,如此,便可依預測出的資料,進行後續的動作。在進行DataMining之前上有許多的前置步驟如下圖1.,而最後需要專業領域人員的Interpretation/Evaluation,才能成為有用的知識。1.進行資料倉儲2.資料選擇與清除3.任務選擇4.選用DataMining演算法5.建立知識patternDatam
7、ining—coreofknowledgediscoveryprocessDataCleaningDataIntegrationDatabasesDataWarehouseTask-relevantDataSelectionDataMiningPatternEvaluation圖1DataMining之前置步驟圖二則為資料採礦進行的步驟,共可分下列八項 1.理解資料與進行的工作 2.獲取相關知識與技術(Acquisition) 3.融合與查核資料(Integrationandchecking) 4.去除錯誤或不一致的資料(Datacleaning) 5.發展模式
此文档下载收益归作者所有