Une sélection d'articles sur l'apprentissage automatique: cas, guides et recherches - août 2020
Nous continuons à collecter des matériaux pour vous dans la zone ML. Comme toujours, nous privilégions les projets qui contiennent des liens vers des référentiels non vides ou qui fournissent des API de haut niveau.
La société MediaPipe, spécialisée dans les solutions de ML ouvertes pour la reconnaissance d'objets dans l'espace - comme FaceMesh et Handpose, sur la base desquelles nous avons assemblé une démo - a présenté un nouvel outil Iris . Comme son nom l'indique, ce modèle d'apprentissage automatique reconnaît l'iris, la pupille et le contour des yeux à l'aide d'une simple caméra RVB en temps réel. Avec une erreur inférieure à 10%, il détermine également la distance entre le sujet et l'appareil photo sans capteurs de profondeur. Malheureusement, bien que l'algorithme ne soit pas capable de déterminer dans quelle direction une personne regarde, tout comme il n'est pas capable d'identifier une personne, mais en combinaison avec Pose Animator, il vous permet de créer plus de personnages animés "vivants", nous attendons donc la tendance des masques de dessins animés.
Non seulement Mediapipe tente de résoudre le problème des équipements périphériques coûteux à l'aide d'algorithmes d'apprentissage automatique - des chercheurs de l'Université de l'Arizona ont développé un moyen d'interagir avec des environnements VR ou AR sans contrôleurs spéciaux.
Leur algorithme reconnaît les mots écrits en l'air avec votre doigt. Il était impossible de se passer de périphériques d'entrée du tout; les développeurs utilisent le capteur de capture de mouvement Leap Motion. GitHub avec le code source et les ensembles de données FMKit.
chercheurs en style et sémantique de l'École technique supérieure suisse de Zurich ont développé un réseau neuronal ouvertqui vous permet de manipuler l'image générée avec des attributs de haut niveau et des descriptions textuelles. A l'entrée du modèle, vous pouvez donner un masque d'objets avec leurs classes. Le réseau neuronal créera une image de structure similaire. Vous pouvez modifier le contenu de l'image à l'aide de requêtes textuelles. Le modèle fonctionne en deux étapes. Sur le premier, l'arrière-plan de l'image est créé, sur le second - le générateur synthétise le premier plan de l'image en tenant compte de l'arrière-plan créé. Cela résout le problème des artefacts qui apparaissent en arrière-plan lors de la suppression ou du déplacement d'images du premier plan.
Si vous créez une application basée sur un langage, comme un chatbot du service client ou un jeu de quête, cet outil pourrait vous intéresser. Semantic Reactor est un plugin Google Sheets qui vous permet d'exécuter des modèles de compréhension du langage naturel sur vos propres données. Ce jeu par navigateur montre de quoi l'outil est capable. Heureusement, il prend également en charge un modèle multilingue formé sur 16 paires, y compris le russe.
L'apprentissage automatique soulève de nombreuses controverses éthiques qui peuvent être résolues ... le même apprentissage automatique. Des chercheurs de l'Université de Chicago ont développé un algorithme qui rend les changements au niveau des pixels invisibles à l'œil humain sur les photographies, de sorte qu'ils deviennent inutilisables pour d'autres modèles. Ils appellent cela le masquage de l'image de process. L'instrument porte le nom de Guy Fawkes, connu de tous grâce au masque anonyme. Les créateurs affirment que des photos déguisées peuvent être publiées sur les réseaux sociaux, et si elles sont utilisées pour former des modèles de reconnaissance faciale, le masquage ne permettra pas au modèle de vous reconnaître sur l'image en raison d'une distorsion. Comme on dit, coin en coin.
Une étude de cas sur l'apprentissage automatique dans l'industrie agricole. John Deere, le plus grand fabricant mondial de matériel agricole, s'est tourné vers l'apprentissage automatique et la vision par ordinateur pour mieux lutter contre les mauvaises herbes. Le réseau neuronal identifie les mauvaises herbes à partir des images, puis les pulvérise instantanément avec des herbicides. Cela économise des ressources sans endommager la récolte. Le framework PyTorch a été utilisé pour entraîner tous les modèles. La première difficulté rencontrée par les créateurs a été la préparation et l'étiquetage des ensembles de données, en raison de la similitude externe des mauvaises herbes avec d'autres cultures. Le déploiement de modèles sur des appareils était également difficile, car le robot doit rapidement prendre des décisions et se déplacer sur le terrain.
L’élaboration de la politique économique et l’évaluation de son efficacité ne suivent pas le rythme des changements dans le monde environnant, comme on peut le constater, par exemple, dans le contexte d’une pandémie mondiale. En outre, les modèles économiques nécessitent de nombreuses hypothèses, ce qui limite leur capacité à décrire pleinement les conditions économiques actuelles: par exemple, ils peuvent étudier l'impôt sur le revenu de manière isolée, mais exclure la taxe à la consommation.
Salesforce propose des algorithmes de ML pour résoudre ces problèmes et a publié un cadre qui utilise l'apprentissage par renforcement et la modélisation économique pour concevoir et évaluer rapidement de nouvelles politiques économiques basées sur des données.
Il n'est pas difficile de rechercher, même dans une grande base de données d'articles, à l'aide de requêtes nécessitant une correspondance exacte du titre ou de l'auteur, car ces paramètres sont facilement indexés. Dans le cas de requêtes plus abstraites, vous ne pouvez plus vous fier aux métriques de similarité, telles que le nombre de mots communs entre deux phrases. Par exemple, la requête «science-fiction» concerne davantage «futur» que «science», même si la deuxième requête contient un mot correspondant à la requête.
Les modèles d'apprentissage automatique sont très bons pour comprendre le langage et peuvent transformer les entrées en représentations vectorielles continues de mots entraînés pour combiner des entrées similaires dans des clusters. Google a introduit un outil de recherche de similarité open source pour ces vecteurs.
Re-rendre une personne basée sur une seule image est une tâche délicate. Les algorithmes modernes créent souvent des artefacts comme une distorsion irréaliste des parties du corps et des vêtements.
Cette étude démontre un nouvel algorithme qui permet aux gens de se changer en nouveaux vêtements grâce à un nouveau rendu de texture. Il présente la posture et la forme du corps dans une grille paramétrique qui peut être reconstruite à partir d'une seule image et facilement modifiée. Au lieu de cartes UV couleur, les créateurs suggèrent d'utiliser des cartes d'attributs pour encoder l'apparence. Jusqu'à présent, la qualité est faible et il n'y a pas de sources, mais vous pouvez déjà imaginer comment cette technologie sera bientôt appliquée dans le commerce électronique.
Bonus: en mai, nous avons dità propos de l'algorithme qui détermine la profondeur des images dans la vidéo, mais il était alors possible d'évaluer uniquement la démonstration vidéo, maintenant le code source du projet est devenu disponible .