欢迎来到天天文库
浏览记录
ID:44273050
大小:136.27 KB
页数:9页
时间:2019-10-20
《研究動機及目的》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、目錄笫1章緒論21丄硏究動機及目的21.2組織架構7第2章背景知識102丄知識發掘10目錄圖1-1導致物品項目支持度和信賴度降低的因素4圖飲料分類階層圖6圖知識發掘流程圖10第1章緒論二十一世紀是資訊爆炸的時代,配合著企業組織陸續地導入資訊科技,再加上網際網路的普及,使得資料量呈現快速且無止盡的擴充成長。因此,如何有效率地從大量的資料中找岀有用的規則已使知識發掘(KnowledgeDiscoveryinDatabase,KDD)或資料採礦(DataMining)成為一個重要的研究課題。"硏究動機及目的在Apriori關聯規則演算法(AssociationRule)中,最小支持度跟最小信賴度是其
2、中最重要的門檻值。凡是低於這兩種門檻值的物品項目,將不可能成為候選項目。這也意味著不能成為候選項目的物品,將也不可能會成為關聯式法則中的後項。舉例來說,買A物品項目而使得消費者會去想購買B物品項目的關聯式法則A-B而言,它的支持度可能只有30%0假設最小信賴度和支持度分別設定為40%及50%,則傳統的Apriori演算法將因為50%的最小支持度門檻值,而將不會產生A-B這項關聯式法則。再來,如果購買A物品項目而讓消費者會去想購買C物品項目的關聯式法則,它的信賴度也僅有40%的話。那麼,也將不會產生A-C這項法則。這是因為兩項法則都低於最小的門檻值。但實際上,在商業市場中,商品並非都是同時推出而
3、向消費大眾行銷。正因為時間的因素,故會導致在關聯規則中較先推出的物品項目支持度和信度較高,而後推出的物品項目支持度和信賴度較低。在這樣的交易資料中的支持度並不能代表物品項目目前的市場佔有率。並且可能因為支持度尚未達到最小支持度的門檻值,而無法產生有關於新產品的關聯式法則。因此,我們必須先將由時間因素而導致支持度不滿足最小支持度的情形排除。如前段所言,只有當關聯法則A-B和A-C這兩條的支持度和信賴度都高於最小門檻值時,才表示這兩條法則是有用的。但在現實生活中,可能並非如此。當A,B或C為後推出之產品。在這兩種狀況下,雖然A-B與A-C的信賴度未達門檻值時,A-BVC的支持度低但信賴度高時,A-
4、BVC也可能是一條有用的法則。如果無法發掘出此法則,對於商業的應用來說可能是一件很可惜的結果。也就是說,當業務人員以A物品項目向消費者推銷時,將無法搭配B或C兩項產品項目一起推薦。為解決此問題,我們將這種複合式後項概念引入關聯式法則中,在A-BVC中,B物品項目跟C物品項目被視為一個複合式物品項§(CompositeItems)[l],那麼在大部分的狀況將可以提昇該物品項目的信賴度跟支持度,進而使得A-BVC這樣的關聯式法則成立。另一種導致物品項目支持度和信賴度降低的因素是產品過多。如圖1.1顯示,通常過度分散商品會使支持度與信賴度降低,而導致無法成功的找出相關的法則,要解決此問題,我們可以採
5、用合併商品的方式來提高其支持度和信賴度。使得一些合於目前市場需求潛在的規則可以被發掘出來。產品過多圖1-1導致物品項目支持度和信賴度降低的因素在上述狀況下,我們常常可以將產品分為大類及小類。像是以飲料來說,我們可以先將飲料分為可樂跟果汁等種類,而在可樂的部分又可以依照各家廠牌分類。這樣分類利用在關聯式法則中稱為階層式關聯式法則(MultilevelAssociationRules)o以上述飲料的例子來說就可以畫出類似圖1.2的樹狀圖。對於圖1.2來說,若A廠商、B廠商和C廠商在交易記錄中出現的記錄很少,則可能很難找出廠商之間的關聯性。很少人同時購買它們,使的A廠商、B廠商、C廠商不太可能滿足最
6、小支持度。傳統的解決方式是將A廠商、B廠商、C廠商廣義化成『可樂』,D廠商、E廠商廣義化成『果汁』。在可樂和果汁之間可以更容易發現兩種類型之間的關聯。就像許多人同時購買『可樂』和『果汁』,而不是同時購買特定的『A廠商』、『B廠商』等。換句話說,使用『可樂』、『果汁』等的項目集合比使用『A廠商』『B廠商』等更可能滿足最小支持度或最小信賴度。但是,D-BVC可能成立,所以若使用傳統的方式這些資訊可能會遺失。Level-1Level-2Level-3圖1-2飲料分類階層圖因此,在本研究中將提出一個演算法,即將多個物品項目產生為一複合項物品後項,並以特定感興趣的商品項目為前項,藉此產TO?生特定感興趣
7、的項目與其他多重項目搭配的關聯式規則。如此,對於上述的例子來說,即使A廠商、B廠商、C廠商的信賴度和支持度不滿足最小信賴度和支持度,也可以利用AUB的複合項提高其支持度和信賴度,進而產生一複合式關聯式法則,讓所發掘出的階層式關聯式法則更有意義。總而言之,關於關聯式法則相關的演算法,如Apriori演算法、DHP演算法、DIC演算法及Princer-Search演算法等,皆必須透過最小支持度產生高頻
此文档下载收益归作者所有