資料探勘中apriori演算法劃分技術為什麼只要兩次實在沒看出有什麼改進啊

1樓：匿名使用者

我想weka應該很適合你吧^^

用來跑一跑自己的演算法或者直接用它的api做二次開發都是很方便的，比如你提到的~只是原始演算法和自己演算法的對比一下是不難實現的，在自己的**裡分別初始化兩個演算法物件模型，一起training一起testing，最後把得出的結果放一起就行了。至於圖形介面怎麼組織就按自己的需要做就好啦。

如果不想寫**的話就用weka自己的圖形介面weka explorer或者work flow跑幾遍也行，因為weka自己的圖形化表示已經很多樣很直觀啦^^

推薦一本書的話就是這個啦：

data mining: practical machine learning tools and techniques (second edition) 作者是ian witten

就是weka的配套教材啦，例子很豐富，由淺入深的，很好上手的。

有進一步的問題就去weka list裡找答案吧，很棒的討論組，起碼對我幫助很大（連線在參考資料裡）。

希望對你有幫助^^

2樓：溫述賀

這個問題提的也太不專業了

資料探勘中的apriori演算法的具體步驟是什麼？

3樓：vincent呂

演算法：apriori

輸入：d - 事務資料庫；min_sup - 最小支援度計數閾值

輸出：l - d中的頻繁項集

方法：l1=find_frequent_1-itemsets(d); // 找出所有頻繁1項集

for(k=2;lk-1!=null;k++)

lk=}

return l=所有的頻繁集；

procedure apriori_gen(lk-1:frequent(k-1)-itemsets)

for each項集l1屬於lk-1

for each項集 l2屬於lk-1

if((l1[1]=l2[1])&&( l1[2]=l2[2])&&……..

&& (l1[k-2]=l2[k-2])&&(l1[k-1]

return ck;

procedure has_infrequent_sub(c:candidate k-itemset; lk-1:frequent(k-1)-itemsets)

for each(k-1)-subset s of c

if s不屬於lk-1 then

return true;

return false;

關於資料探勘中的apriori演算法，幫忙推出關聯規則事務數為 5 支援度為0.6，置信度為0.6

4樓：屁屁豬美女

abc的支援

數p1=3，acd的支援數p2=3，bcd的支援數p3=3，關聯規則的輸出就

版是在由頻繁項集的權項組成的關聯規則中，找出置信度大於等於最小置信度閾值的關聯規則。因為由頻繁項集的項組成的關聯規則的支援度大於等於最小支援閾值，所以規則產生過程就是在由頻繁項集的項組成的關聯規則中，找出置信度大於等於最小置信度閾值的強關聯規則，基本步驟如下：

1）對於每個頻繁項集l，產生l的所有非空真子集。

2）對於l的每個非空真子集，如果l的支援計數除以的支援計數大於等於最小置信度閾值min_conf，則輸出強關聯規則 =>（l- ）。

例如：abc的非空真子集有a，b，c，ab，ac，bc。分別算出他們的支援數，再除以abc的支援數，若結果大於0.

6則可輸出強關聯規則。pa/p1=4/3>0.6,則可以輸出關聯規則：

a=>bc；同理可輸出強關聯規則：b=>ac，c=>ab；

同理，對於acd，bcd採用同樣地方法。

5樓：糊塗小仙

對於每個頻繁項集x，有非空子集y，如果support(x)/support(y)>=0.6（置信度閾值），那麼輸出規則x->(x-y)

給你舉個

專例子：屬

abc，有非空子集ac，support(acb)/support(ac)=3/4=0.75>=0.6，那麼輸出規則abc->b

建議你寫程式做吧。

以上是我的理解，希望對你有用~

資料探勘中apriori演算法劃分技術為什麼只要兩次實在沒看出有什麼改進啊

資料探勘對聚類的資料要求是什麼，資料探勘中聚類演算法資料集在什麼地方獲取的

資料探勘中什麼是可信度，資料探勘中什麼是可信度

資料結構中演算法分析的問題

其他用戶還看了：

資料探勘中apriori演算法劃分技術為什麼只要兩次實在沒看出有什麼改進啊

資料探勘對聚類的資料要求是什麼，資料探勘中 聚類演算法 資料集在什麼地方獲取的

資料探勘中什麼是可信度，資料探勘中什麼是可信度

資料結構中演算法分析的問題

其他用戶還看了：

資料探勘對聚類的資料要求是什麼，資料探勘中聚類演算法資料集在什麼地方獲取的