Le ML n'est pas content: ce qui peut échouer dans un projet d'apprentissage automatique



Alena Gaybatova et Ekaterina Stepanova, expertes dans la direction des solutions analytiques de KORUS Consulting Group .





Tout le monde veut gagner de l'argent et économiser avec les données: l'application des méthodes de ML même sur un projet permet de réaliser des économies significatives ou même une croissance des revenus. Mais pour ressentir l'effet et ne pas échouer la mise en œuvre, il faut prendre en compte les difficultés et éviter les erreurs de gestion. À l'aide d'un exemple, nous vous expliquerons comment nous assurer que les algorithmes d'apprentissage automatique ne font pas d'erreur.





Apprentissage automatique - seulement 5% des ressources du projet. Mais la complication de la logique ML peut conduire à une augmentation du temps de mise en œuvre, et une mauvaise planification de la collecte de données peut conduire à une analyse inexacte qui peut devenir inutile et coûteuse. Pourquoi cela arrive-t-il?





Le problème des attentes

L'entreprise a entendu quelque part qu'un réseau neuronal est la solution à tous les problèmes. Dans le même temps, la qualité ou le volume des données laisse beaucoup à désirer - il est tout simplement impossible de mettre en œuvre un modèle dans de telles conditions. Par exemple, il faut environ un an pour accumuler des données dans la vente au détail ou dans la fabrication, et si l'équipement nécessaire n'est pas disponible ou si certains processus ne sont pas numérisés, alors encore plus longtemps.





Pour éviter toute confusion, nous recommandons de négocier des résultats spécifiques avec une mise en garde sur les exigences de lancement du système, plutôt qu'une vague opportunité de revenus. De telles illusions sont vécues non seulement par les entreprises, mais aussi par les développeurs eux-mêmes. Parfois, les analystes commerciaux s'attendent à ce que les modèles fonctionnent correctement en fonction de ce qu'ils lisent dans des articles techniques complexes. Malheureusement, de tels textes décrivent des algorithmes développés sur des données de modèle, pas des données réelles.





Par conséquent, les résultats du projet doivent être utiles, facilement interprétables et validés par des métriques et des experts métier.





Faux locaux

- ML-. , 2019 90%. 2020 , —  c , .





. .





, , , . : . , , . , . 2020 - , , . .





: , .





: - , . , , . , , .





. – . .





.





1. ? , ? ?





value . , . , 100%, , «» . : 50% , «».





2. ML? ? , – ?





, . - . , .





3. ?





– , ML-. , . , -.





4. ?





, ML – . - ML, , . , , . , . , , .






Le ML est un excellent outil pour optimiser le travail, résoudre des problèmes non standard et analyser de grandes quantités de données. Il est important de considérer de nombreux aspects pour son utilisation avant et après la mise en œuvre. Espérons que cet aperçu rapide permettra d'éviter les situations indésirables et de minimiser les tracas liés à l'utilisation du ML afin que vous puissiez profiter des avantages supplémentaires de la technologie.








All Articles