introduction
Dans le monde moderne, la tâche de segmentation, comme il s'est avéré, est résolue une ou deux fois, même si je pensais que c'était quelque chose de compliqué et de surprenant. Il suffit de lire quelques articles, d'installer certaines bibliothèques et de baliser les données, tout ce qui prend quelques heures, sauf pour créer un échantillon de test.
Balisage des données
Cette étape de la mise en œuvre de la segmentation des images de flux vidéo est l'une des plus exigeantes en termes de travail humain.
Pour ce faire, vous devez utiliser des programmes spéciaux pour marquer les images du flux vidéo. Nous ouvrons simplement le fichier vidéo requis avec ce programme et marquons les images, après avoir créé au préalable des classes dans lesquelles nous segmenterons les images. Dans mon exemple introductif, les cadres sont divisés dans les classes suivantes (voiture, route, passage pour piétons, pelouse, bâtiments, personnes, trottoir, marquages routiers).
En fait, des positions telles que la route, les bâtiments, les pelouses, les trottoirs, etc. il est possible de ne pas le reconnaître, puisque la caméra dans ce cas est fixée de manière rigide et donc ces zones seront toujours au même endroit.
Formation d'un réseau neuronal pour la segmentation d'image
( , ).
.
, . 4 (, , ... , , , ) 60 DeepLab v3+ ( ResNet-18). . 2.
, , , . .
, (. 3 4), .

, (. 5 6).

, , (. 7 9). (. 8).
3%, 54%. , . , , , . .



, . ( ), , .
- , . ( , ), . ., . , . , , . , , , , , , .
PS Si quelqu'un sait quel logiciel peut être utilisé pour enregistrer un flux vidéo à partir d'un flux YouTube aussi simplement que possible?) Les caméras écrivent simplement des données dans un tampon circulaire (les 12 dernières heures) sous la forme d'un flux YouTube, formant ainsi une surveillance vidéo, où chaque habitant de la maison peut voir les 12 dernières heures.