Les gars, bonjour! Aujourd'hui, l'équipe ProductStar a préparé pour vous un article dans lequel nous avons examiné les principes généraux de fonctionnement et les domaines d'application de l'arbre de décision.
L'arbre de décision est une méthode d'analyse automatique de grands ensembles de données. Dans cet article, nous examinerons les principes généraux de fonctionnement et les domaines d'application.
L'arbre de décision est un puissant outil d'exploration de données et d'analyse prédictive. Cela aide à résoudre les problÚmes de classification et de régression.
, « âŠ, ...». .
, , : , « 1000 , ».
( ), . , â .
, â , . :
â ;
â .
1950- . .
. ( ID3 4.5 5.0) , CART .
. â , â (node) (leaf). .
: , :
â , ;
â , .
, . , . , , .
. â , , â . , , , .
, . . , , .
, , .
?
, , . :
. . .
( ). .
. . , , .
â . ? , .
:
â ;
â , .
«» , - ( ), . , , . , , .
, , « ». S, :
n , Ci(i = 1..k);
m Aj(j = 1..m), .
:
S Ci, , . , , «» . , Ci. , .
S â . , . , .
S Ck. . Aj S, : a1, a2, âŠ, ap), p â . S p (S1, S2, âŠ, Sp), . , . , .
, . , .
: ID3, CART, C4.5, C5.0, NewId, ITrule, CHAID, CN2 . :
ID3 (Iterative Dichotomizer 3). . , ID3, . . .
C4.5. «» ID3, . 2008 Spring Science , C4.5 â Data Mining.
CART (Classification and Regression Tree). , . CART , .
4 :
.
.
.
.
.
, . , . â .
, - .
-
:
n â , Ni â i- , N â .
. , , . , .
Aj , .
. â . , :
Info(S) â , S , Info(Sa) â , , A.
Gain(A), . - « .
. , . â .
, . .
:
Q â , n â , pi â i- ( ).
0 1. 0, , . 1, , . , .
«» . , . - . . , .
. , . â .
, «».
:
. (, ). â . â . - .
. . .
. (, 7). .
, . , - . - , .
«» , . , 2-3 , .
â , , . â .
: NP- , , , . , 3 :
, .
: ( ) ( ).
, .
, , .
« » â . , .
, . , .
. , .
( ), .
:
. , « < 40 , ». .
, .
, «» , ( ).
.
.
, .
:
. , .
, - .
, - « », .
: , 100- .
, , .
?
. , .
:
. .
. ( ), (, ) ..
. .
. .
. .
. , - .
, . ProductStar vc -.
. , , .