
Habr, bonjour!
Dans le laboratoire de modélisation des systèmes naturels du Centre national pour le développement cognitif de l'Université ITMO, nous recherchons activement l'utilisation de l'apprentissage automatique automatique pour diverses tâches. Dans cet article, nous voulons parler de l'utilisation d'AutoML pour des prévisions de séries chronologiques efficaces, ainsi que de la façon dont cela est implémenté dans le cadre open-source FEDOT . Il s'agit du deuxième article d'une série de publications consacrées à ce développement (le premier d'entre eux peut être trouvé ici ).
Tous les détails sont sous la coupe!
Apprentissage automatique (AutoML)
La science des données moderne est devenue une partie très populaire de la sphère informatique. Les experts collectent des données, les nettoient, essayent différents modèles, effectuent des validations et choisissent les meilleurs. Et tout cela afin de fournir à l'entreprise la solution qui apportera le plus de valeur. Dans le même temps, certaines étapes d'obtention de telles solutions sont de plus en plus automatisées chaque année. En règle générale, cela s'applique aux pièces les plus courantes. Cela libère le temps des experts pour des tâches plus importantes.
Imaginons donc qu'un spécialiste soit confronté à la tâche de créer un modèle d'apprentissage automatique et de le «envelopper» dans un service Web afin que ce modèle même fasse un travail utile - prédire quelque chose. Mais avant d'arriver au stade de la formation du modèle, vous devez passer par plusieurs étapes, notamment:
- collecter des données de nombreuses sources, les nettoyer;
- , , ;
- , ;
- .
, , . , , , , . , - , . — MLFlow, Apache AirFlow . — - workflow management system (WMS) . .
, ?
, “”, . “” ML .
. , , open-source, TPOT, AutoGluon, MLJAR H2O. AutoML “ , ( ) ”. , . ( ) , : TPOT FEDOT.
SaaS-, DataRobot, GoogleAutoTables, Amazon SageMaker, ML , AutoML.
, AutoML : . , , . , .
, , open-source . , — ( ).
, . : , . : , , — . AutoML legacy — , ( “ ”) : , .
, - , — . open-source — AutoTS. “” — AR ARIMA. “” , ( ), . , , pmdarima.
— AutoML- . . , , H2O, . , open-source , , , . .
AutoML-?
, , . :
- (, , — , — );
- ;
- () ;
- ( -);
- in-sample out-of-sample ;
- — ?
, , , — .
AutoML . , , data-driven , .. , .. - .
AutoML, . , open-source AutoML , — FEDOT.
, , — . , , , (, ). .
, , . , , .. , , , . , , baseline .
, , (, , ).
. , , . FEDOT, , .
, FEDOT , :
- — , : (, , ) , ;
- — , . . Primary , Secondary — ;
- — , . FEDOT ( Chain).
:
, FEDOT
, , , .
. “”, — . — . — “” AutoML. , . , — .
FEDOT
, . FEDOT- . ? , , ? ?
! .
. — , . , . , , :

“lagged-“ . FEDOT “lagged”. — .
1 . , . muli-target . :

. 3 lagged
. , AR ARIMA. , .
: — . — . ⋅.

, , . — , , . , .
14 . , — .
, . , . , , jupyter notebook’.
— . FEDOT :
- , ;
- ;
- .
, , , . . . . .
, ,
lagged-, , ridge- (. ), “”.
, — “”. , , .
. , , . , , . ( ) . — — . . , , , . ( ) , — .
:
! “” . . . () (). FEDOT.
, :
(, — )
.
AutoML. FEDOT , API.
, “”. AutoML :
- — . , , . , , “” . ;
- — , , . , .
:
.
. : (MAE) (RMSE): MAE — 100.52, RMSE — 120.42.
, : ?
: . . 14 . 14 ( 42). in-sample .
, out-of-sample in-sample :
. in-sample out-of-sample
, 14 . 28 — 2 14 . , (out-of-sample).
, in-sample . ( ). , , .
FEDOT — 3- 14 . . . , , .
14 .
. , , .
( ). , ,
, . , , , . , .
— K- , . , . K- . — .
, , , .
, “” ,
, — , 1000 ⋅, 0. . (, ) . K-nn . , , : MAE — 88.19 RMSE — 177.31.
, - . 5 . , , .
: . , , . , -, ( ). : . , FEDOT , . !
FEDOT open-source — AutoTS pmdarima. Jupyter notebook , , . , . 3 , . ( - ):
| ∓ | RMSE∓CKO | |
|---|---|---|
| pmdarima | 155∓1 | 196∓1 |
| AutoTS | 198∓22 | 236∓41 |
| FEDOT | 110∓14 | 170∓26 |
:

, FEDOT “ ”.
, , AutoML. , ML-, .
AutoML FEDOT: , . FEDOT .
:
AutoML, FEDOT!
A travaillé sur l'article: Mikhail Sarafanov , Pavel Vychuzhanin et Nikolai Nikitin .
