決策樹演算法是哪個學科要學的內容啊

時間 2021-09-03 03:28:46

1樓:匿名使用者

決策樹演算法是一種逼近離散函式值的方法。它是一種典型的分類方法,首先對資料進行處理,利用歸納演算法生成可讀的規則和決策樹,然後使用決策對新資料進行分析。本質上決策樹是通過一系列規則對資料進行分類的過程。

決策樹方法最早產生於上世紀60年代,到70年代末。由j ross quinlan提出了id3演算法,此演算法的目的在於減少樹的深度。但是忽略了葉子數目的研究。

c4.5演算法在id3演算法的基礎上進行了改進,對於**變數的缺值處理、剪枝技術、派生規則等方面作了較大改進,既適合於分類問題,又適合於迴歸問題。

決策樹演算法構造決策樹來發現資料中蘊涵的分類規則.如何構造精度高、規模小的決策樹是決策樹演算法的核心內容。決策樹構造可以分兩步進行。第一步,決策樹的生成:

由訓練樣本集生成決策樹的過程。一般情況下,訓練樣本資料集是根據實際需要有歷史的、有一定綜合程度的,用於資料分析處理的資料集。第二步,決策樹的剪枝:

決策樹的剪枝是對上一階段生成的決策樹進行檢驗、校正和修下的過程,主要是用新的樣本資料集(稱為測試資料集)中的資料校驗決策樹生成過程中產生的初步規則,將那些影響預衡準確性的分枝剪除。

2樓:小薛機械

管理學裡面有的

學計算機的應該也學把~

一般是資料探勘時會用到。

決策樹的演算法

3樓:粉絲吧

c4.5演算法繼承了id3演算法的優點,並在以下幾方面對id3演算法進行了改進:

1) 用資訊增益率來選擇屬性,克服了用資訊增益選擇屬性時偏向選擇取值多的屬性的不足;

2) 在樹構造過程中進行剪枝;

3) 能夠完成對連續屬性的離散化處理;

4) 能夠對不完整資料進行處理。

c4.5演算法有如下優點:產生的分類規則易於理解,準確率較高。

其缺點是:在構造樹的過程中,需要對資料集進行多次的順序掃描和排序,因而導致演算法的低效。此外,c4.

5只適合於能夠駐留於記憶體的資料集,當訓練集大得無法在記憶體容納時程式無法執行。

具體演算法步驟如下;

1建立節點n

2如果訓練集為空,在返回節點n標記為failure

3如果訓練集中的所有記錄都屬於同一個類別,則以該類別標記節點n

4如果候選屬性為空,則返回n作為葉節點,標記為訓練集中最普通的類;

5for each 候選屬性 attribute_list

6if 候選屬性是連續的then

7對該屬性進行離散化

8選擇候選屬性attribute_list中具有最高資訊增益率的屬性d

9標記節點n為屬性d

10for each 屬性d的一致值d

11由節點n長出一個條件為d=d的分支

12設s是訓練集中d=d的訓練樣本的集合

13if s為空

14加上一個樹葉,標記為訓練集中最普通的類

15else加上一個有c4.5(r - ,c,s)返回的點 背景:

分類與迴歸樹(cart——classification and regression tree)) 是一種非常有趣並且十分有效的非引數分類和迴歸方法。它通過構建二叉樹達到**目的。

分類與迴歸樹cart 模型最早由breiman 等人提出,已經在統計領域和資料探勘技術中普遍使用。它採用與傳統統計學完全不同的方式構建**準則,它是以二叉樹的形式給出,易於理解、使用和解釋。由cart 模型構建的**樹在很多情況下比常用的統計方法構建的代數學**準則更加準確,且資料越複雜、變數越多,演算法的優越性就越顯著。

模型的關鍵是**準則的構建,準確的。

定義:分類和迴歸首先利用已知的多變數資料構建**準則, 進而根據其它變數值對一個變數進行**。在分類中, 人們往往先對某一客體進行各種測量, 然後利用一定的分類準則確定該客體歸屬那一類。

例如, 給定某一化石的鑑定特徵, **該化石屬那一科、那一屬, 甚至那一種。另外一個例子是, 已知某一地區的地質和物化探資訊, **該區是否有礦。迴歸則與分類不同, 它被用來**客體的某一數值, 而不是客體的歸類。

例如, 給定某一地區的礦產資源特徵, **該區的資源量。

實現id3決策樹學習演算法,實現ID3決策樹學習演算法

這裡有些。diversity 整體 diversity 左節點 diversity 右節點 值越大,分割就越好。三種diversity的指標 1.min p c1 p c2 2.2p c1 p c2 3.p c1 logp c1 p c2 logp c2 這幾個引數有相同的性質 當其中的類是均勻分佈...

演算法工程師一般是學什麼出身?求解答

不吶吶丩 演算法工程師一般都是學的資料探勘和機器學習,而且對專業要求比較高,對能力也有一定的限制。演算法工程師是一個非常高階的職位 學歷要求 本科及其以上的學歷,大多數是碩士學歷及其以上 語言要求 英語要求是熟練 必須掌握計算機相關知識,必須會一門程式語言 手機使用者 我覺得都很有意思。軟體工程更多...

中國哪個地方有真正的紅豆樹,這是什麼樹,是紅豆樹嗎?

在我國大陸地區,兩廣,福建一帶有紅豆樹。往北一些的地方,四川,江蘇各有一顆千年紅豆古樹,其它的就沒有聽說過了 紅豆生南國,春來發幾枝,很明顯是中國的南方,紅豆樹即相思樹,別的地方我就不知了,但在我們的老家公路兩旁種的都是這種樹,還有一個叫鳳凰嶺的小山坡種的全是相思樹,我們老家是廣西柳州鳳山鎮,絕對正...