5 approches du balisage des données pour les projets d'apprentissage automatique

Lorsque nous avons repensé notre cours Deep Learning à la fin de l'année dernière pour le rendre plus visuel et orienté cas à partir de la pratique commerciale réelle, nous avons inclus un nouveau module sur le balisage des données sur la plateforme de foule Yandex.Toloka. 

Mais comme le crowdsourcing n'est pas le seul moyen de baliser, nous avons préparé pour les nouveaux étudiants du cours une traduction de cet article du blog Lionbridge avec un aperçu des principales approches du balisage de données. Nous espérons que vous le trouverez également utile.

La qualité d'un projet d'apprentissage automatique dépend directement de la façon dont vous abordez la solution de 3 tâches principales: la collecte de données, son prétraitement et son balisage.

Le balisage est généralement un processus complexe et long. Par exemple, les systèmes de reconnaissance d'images impliquent souvent de dessiner des cadres de délimitation autour des objets, tandis que les systèmes de recommandation de produits et les systèmes d'analyse des sentiments peuvent exiger la connaissance du contexte culturel. N'oubliez pas non plus qu'un tableau de données peut contenir des dizaines ou plus de milliers d'échantillons nécessitant un balisage.

, , . , 5 . 

:

In-house: , . : . , , , -. 

: , . ., . , , . , ; , . , , . 

: – . - , . , , . , , . 

: , , . - (GAN). GAN ( ), . - . GAN . . , , , . 

« »: . , , . , , , . , , .  

 

In-house

 

 

,

 

,

 

 

 

. : , , , . . 

-------------

Deep Learning 6.0 Newprolab 9 .

- Deep Learning 7.0 - c 30 22 2021 .




All Articles