資料探勘中apriori演算法劃分技術為什麼只要兩次實在沒看出有什麼改進啊

時間 2021-10-14 21:23:07

1樓:匿名使用者

我想weka應該很適合你吧^^

用來跑一跑自己的演算法或者直接用它的api做二次開發都是很方便的,比如你提到的~只是原始演算法和自己演算法的對比一下是不難實現的,在自己的**裡分別初始化兩個演算法物件模型,一起training一起testing,最後把得出的結果放一起就行了。至於圖形介面怎麼組織就按自己的需要做就好啦。

如果不想寫**的話就用weka自己的圖形介面weka explorer或者work flow跑幾遍也行,因為weka自己的圖形化表示已經很多樣很直觀啦^^

推薦一本書的話就是這個啦:

data mining: practical machine learning tools and techniques (second edition) 作者是ian witten

就是weka的配套教材啦,例子很豐富,由淺入深的,很好上手的。

有進一步的問題就去weka list裡找答案吧,很棒的討論組,起碼對我幫助很大(連線在參考資料裡)。

希望對你有幫助^^

2樓:溫述賀

這個問題提的也太不專業了

資料探勘中的apriori演算法的具體步驟是什麼?

3樓:vincent呂

演算法:apriori

輸入:d - 事務資料庫;min_sup - 最小支援度計數閾值

輸出:l - d中的頻繁項集

方法:l1=find_frequent_1-itemsets(d); // 找出所有頻繁1項集

for(k=2;lk-1!=null;k++)

lk=}

return l=所有的頻繁集;

procedure apriori_gen(lk-1:frequent(k-1)-itemsets)

for each項集l1屬於lk-1

for each項集 l2屬於lk-1

if((l1[1]=l2[1])&&( l1[2]=l2[2])&&……..

&& (l1[k-2]=l2[k-2])&&(l1[k-1]

return ck;

procedure has_infrequent_sub(c:candidate k-itemset; lk-1:frequent(k-1)-itemsets)

for each(k-1)-subset s of c

if s不屬於lk-1 then

return true;

return false;

關於資料探勘中的apriori演算法,幫忙推出關聯規則 事務數為 5 支援度為0.6,置信度為0.6

4樓:屁屁豬美女

abc的支援

數p1=3,acd的支援數p2=3,bcd的支援數p3=3,關聯規則的輸出就

版是在由頻繁項集的權項組成的關聯規則中,找出置信度大於等於最小置信度閾值的關聯規則。因為由頻繁項集的項組成的關聯規則的支援度大於等於最小支援閾值,所以規則產生過程就是在由頻繁項集的項組成的關聯規則中,找出置信度大於等於最小置信度閾值的強關聯規則,基本步驟如下:

1) 對於每個頻繁項集l,產生l的所有非空真子集。

2) 對於l的每個非空真子集 ,如果l的支援計數除以 的支援計數大於等於最小置信度閾值min_conf,則輸出強關聯規則 =>(l- )。

例如:abc的非空真子集有a,b,c,ab,ac,bc。分別算出他們的支援數,再除以abc的支援數,若結果大於0.

6則可輸出強關聯規則。pa/p1=4/3>0.6,則可以輸出關聯規則:

a=>bc;同理可輸出強關聯規則:b=>ac,c=>ab;

同理,對於acd,bcd採用同樣地方法。

5樓:糊塗小仙

對於每個頻繁項集x,有非空子集y,如果support(x)/support(y)>=0.6(置信度閾值),那麼輸出規則x->(x-y)

給你舉個

專例子:屬

abc,有非空子集ac,support(acb)/support(ac)=3/4=0.75>=0.6,那麼輸出規則abc->b

建議你寫程式做吧。

以上是我的理解,希望對你有用~

資料探勘對聚類的資料要求是什麼,資料探勘中 聚類演算法 資料集在什麼地方獲取的

1.可擴充套件性 scalability 大多數來自於機器學習和統計學領域的聚類演算法在處理數百條資料時能表現出高效率 2.處理不同資料型別的能力 數字型 二元型別,分型別 標稱型,序數型,比例標度型等等3.發現任意形狀的能力 基於距離的聚類演算法往往發現的是球形的聚類,其實現實的聚類是任意形狀的4...

資料探勘中什麼是可信度,資料探勘中什麼是可信度

叫做置信度,而非可信度。confidence。對於一條 條件 結論 的規則,置信度的分母是其條件出現的樣本數 分子是條件和結論同時出現的樣本數。 劉鵬 可信度?應該是置信度吧?如果你問的是資料探勘,我想應該是關聯規則中的置信度 confidence 關聯規則舉例,如果我們關心居民購買的關聯規則,想知...

資料結構中演算法分析的問題

武當單挑王 第一個第二個問題,就相當於你高中學的f x 沒什麼實際意義,也不用糾結 為什麼用t表示呢,代表時間 而一般所說的時間複雜度,都是用大o表示的 你學過函式應該知道,次數最高的那項對函式的增長影響最大,所以這裡可以忽略其他低次項 前面的係數也可以省去,對於這個程式的就是o n2 幻世萌 線性...