2、時間去看的程度。這有一點像我們的醫療體系。早先的醫生要望聞問切,在少量的數據裡,設法組合出最好的治療方案。現在則是一個名醫,一上午要門診到一百五十個病人以上。他只能靠algorithm來看病:問一兩個問題,聽一兩個問題,然後開藥。這是DM的精神,並不是傳統的dataanalysis的精神。▲ TOP 定義不同的人有不同的看法:比較樂觀的是BerryandLinoff(1997)的說法:●分析報告給你後見之明(hindsight)●統計分析給你先機(foresight)●DM給你識見(insight)這話說得太強,我不是那麼地相信。因為這三者都是在既有的資料上
4、etheimportanceofdatamining,inpracticetheprofititbringshasturnedouttobesurprisinglylimitedinmanykeybusinesses."(Kann2000)比較中肯的是Handetal(2000)的說法:"Dataminingistheprocessofseekinginterestingorvaluableinformationinlargedatabases"▲ TOP 方法Demming(1943)曾說:「蒐集數據的目的是為了行動」。這是在數據的蒐集並不便宜的時候所說的
7、tion自局部的角度來看DM,到目前為止,主要的目的是patterndetection。這和我們常聽到的patternrecognition頗有不同。用雷達找飛機的工作,算是後者──我們知道飛機是我們要找的對象。但是在DM中,多半我們並不知道要找甚麼。在技術上,這也不能靠抽樣來做。而主要的想法之一,是靠「算則(algorithms)」而不是靠統計。Pattern是指數據的局部結構,因此在這一部分,DM強調的反而是算則。這當然並不奇怪,數據一多,用人力是不能做的,我們只有靠明確的指令讓電腦一個一個幫我們找。▲ TOP 工具知名的軟體,像SAS,SPSS,SPL