📕 🖤 👩🏿‍🏫 Que sont les réseaux de neurones graphiques 🙍🏼 💙 🐣

Les réseaux de graphes sont un moyen d'appliquer des modèles de réseaux de neurones classiques à des données graphiques. Les graphes, n'ayant pas de structure régulière comme des images (chaque pixel a 8 voisins) ou des textes (une séquence de mots), sont longtemps restés à l'écart des modèles neuronaux classiques, largement répandus dans le domaine de l'apprentissage automatique et de l'intelligence artificielle . La plupart des modèles de vectorisation de graphes (construisant une représentation vectorielle des sommets dans un graphe) étaient plutôt lents et utilisaient des algorithmes basés sur la factorisation matricielle ou la décomposition spectrale de graphe. En 2015-2016, des modèles de marche aléatoire plus efficaces (DeepWalk, Line, Node2vec, Hope) sont apparus. Cependant, ils avaient également des limites, car ils n'affectaient en aucun cas les fonctionnalités supplémentaires lors de la construction d'un modèle vectoriel du graphe,qui peut être stocké aux sommets ou aux arêtes. L'émergence des réseaux de neurones graphiques est devenue une suite logique de la recherche dans le domaine des plongements de graphes et a permis d'unifier les approches précédentes sous un même cadre.

À quoi servent-ils et comment ils sont organisés

Une couche d'un réseau neuronal graphique est une couche ordinaire entièrement connectée d'un réseau neuronal, mais les poids qu'il contient ne sont pas appliqués à toutes les données d'entrée, mais uniquement à celles qui sont voisines d'un sommet particulier dans le graphique, en plus de sa propre représentation de la couche précédente. Les poids pour les voisins et le sommet lui-même peuvent être définis par une matrice de poids commune ou par deux matrices distinctes. Des normalisations peuvent être ajoutées pour accélérer la convergence; les fonctions d'activation non linéaires peuvent varier, mais la construction générale reste similaire. Dans le même temps, les réseaux convolutifs de graphes tirent leur nom de l'agrégation des informations de leurs voisins, bien que les mécanismes d'attention des graphes (GAT) ou le modèle d'apprentissage inductif (GraphSAGE) soient beaucoup plus proches de cette définition.

Application

Systèmes de recommandation

Les graphiques évoluent dans le cadre des interactions des utilisateurs avec les produits sur les plateformes de commerce électronique. En conséquence, de nombreuses entreprises utilisent des réseaux de neurones graphiques pour créer des systèmes de recommandation. Habituellement, les graphiques sont utilisés pour modéliser l'interaction des utilisateurs avec les produits, enseigner les intégrations en tenant compte d'un échantillon négatif correctement sélectionné et, en classant les résultats, des offres personnalisées de produits sont sélectionnées et présentées à des utilisateurs spécifiques en temps réel. L'un des premiers services avec un tel mécanisme a été Uber Eats : le réseau de neurones GraphSage sélectionne des recommandations pour la nourriture et les restaurants.

Alors que les graphiques sont relativement petits pour les recommandations alimentaires en raison de contraintes géographiques, certaines entreprises utilisent des réseaux de neurones avec des milliards de connexions. Par exemple, le géant chinois Alibaba a lancé des représentations graphiques et des réseaux de neurones graphiques pour des milliards d'utilisateurs et de produits. Créer de tels graphiques est un cauchemar pour les développeurs. Mais grâce au pipeline Aligraphvous pouvez créer un graphique de 400 millions de nœuds en seulement cinq minutes. Impressionnant. Aligraph prend en charge un stockage de graphiques efficace et distribué, des opérateurs de récupération optimisés et un ensemble de réseaux de neurones graphiques natifs. Ce pipeline est désormais utilisé pour des recommandations et des recherches personnalisées sur les nombreux produits de l'entreprise.

Pinterest a proposé un modèle PinSage qui correspond efficacement aux voisins en utilisant un PageRank personnalisé et met à jour les intégrations de sommets en agrégeant les informations des voisins. Le prochain modèle PinnerSagepeut déjà travailler avec des multi-embeddings pour prendre en compte les différents goûts des utilisateurs. Ce ne sont là que quelques exemples notables dans le domaine des systèmes de recommandation. Vous pouvez également lire sur l'exploration par Amazon des graphiques de connaissances et des réseaux de neurones graphiques , ou sur l'utilisation par Fabula AI des réseaux de neurones graphiques pour détecter les fausses nouvelles . Mais même sans cela, il est évident que les réseaux de neurones graphiques montrent des résultats prometteurs avec un signal significatif des interactions des utilisateurs.

Optimisation combinatoire

Les solutions d'optimisation combinatoire sont au cœur de nombreux produits importants dans les domaines de la finance, de la logistique, de l'énergie, de la science et de la conception électronique. La plupart de ces tâches sont décrites à l'aide de graphiques. Et au cours du siècle dernier, beaucoup d'efforts ont été consacrés à la création de solutions algorithmiques plus efficaces. Cependant, la révolution de l'apprentissage automatique nous a donné de nouvelles approches convaincantes. L'

équipe Google Brain a utilisé des réseaux de neurones graphiques pour optimiser la consommation d'énergie, la surface et les performances des puces pour un nouveau matériel tel que Google TPU... Un processeur informatique peut être représenté sous forme de graphe mémoire et de composants logiques, chacun avec ses propres coordonnées et type. Déterminer l'emplacement de chaque composant, en tenant compte des contraintes de densité de placement et d'acheminement des charges, est toujours un processus chronophage, une œuvre d'art pour les électroniciens. La combinaison du modèle graphique avec l'apprentissage des politiques et du renforcement permet de trouver un placement optimal des puces et de créer des puces plus performantes que celles conçues par des humains.

Une autre approche consiste à intégrer le modèle d'apprentissage automatique dans les outils de solution existants. Par exemple, une équipe dirigée par M. Gassa proposé un réseau de graphes qui apprend les politiques de sélection de variables branch-and-bound: une opération critique dans les outils de solution de programme linéaire mixte (MILP). En conséquence, les représentations apprises tentent de minimiser la durée des outils de solution et démontrent un bon compromis entre la vitesse de sortie et la qualité de la solution.

Dans une collaboration plus récenteDeepMind et Google utilisent des réseaux de graphes dans deux sous-problèmes clés résolus par les outils MILP: la co-affectation de variables et la contrainte sur les valeurs cibles. L'approche proposée basée sur le réseau de neurones s'est avérée 2 à 10 fois plus rapide que les outils de solution existants utilisant d'énormes ensembles de données, y compris ceux utilisés par Google pour les systèmes d'emballage et de planification de produits. Si vous êtes intéressé par ce domaine, vous pouvez recommander quelques études récentes ( 1 , 2 ), qui discutent beaucoup plus en profondeur de la combinaison des réseaux de neurones graphiques, de l'apprentissage automatique et de l'optimisation combinatoire.

Vision par ordinateur

Les objets du monde réel sont profondément interconnectés, de sorte que les images de ces objets peuvent être traitées avec succès à l'aide de réseaux de neurones graphiques. Par exemple, vous pouvez percevoir le contenu d'une image à travers des graphiques de scène - un ensemble d'objets dans une image avec leurs relations. Les graphiques de scène sont utilisés pour rechercher des images, comprendre et donner un sens à leur contenu, ajouter des sous-titres, répondre à des questions visuelles et générer des images. Ces graphiques peuvent grandement améliorer les performances de vos modèles.

Dans l'une des œuvres de Facebookdécrit que vous pouvez placer des objets du jeu de données COCO populaire dans un cadre, définir leurs positions et leurs tailles, et sur la base de ces informations, un graphique de scène sera créé. Avec son aide, le réseau neuronal graphique détermine les plongements d'objets, à partir desquels, à son tour, le réseau neuronal convolutif crée des masques d'objets, des cadres et des contours. Les utilisateurs finaux peuvent simplement ajouter de nouveaux nœuds au graphique (en définissant la position relative et la taille des nœuds) afin que les réseaux de neurones puissent générer des images avec ces objets.

Une autre source de graphes en vision par ordinateur est la juxtaposition de deux images interconnectées. Il s'agit d'un problème classique qui était auparavant résolu manuellement en créant des descripteurs. Magic Leap, une société de graphisme 3D a créé une architecture basée sur des réseaux de neurones graphiques appelée SuperGlue . Cette architecture permet une correspondance vidéo en temps réel pour la relecture de scènes 3D, la reconnaissance de l'emplacement, la localisation et la cartographie simultanées (SLAM). SuperGlue consiste en un réseau neuronal graphique basé sur le mécanisme d'attention. Il vous apprend à trouver les points clés de l'image, qui sont ensuite transférés vers la couche de transport optimale pour la correspondance. Sur les cartes vidéo modernes, le modèle est capable de fonctionner en temps réel et peut être intégré aux systèmes SLAM. Plus d'informations sur la combinaison de graphiques et de vision par ordinateur sont décrites dans ces études: 1 , 2 .

Physique et chimie

La représentation des interactions entre particules ou molécules sous forme de graphiques et la prédiction des propriétés de nouveaux matériaux et substances à l'aide de réseaux de neurones graphiques permet de résoudre divers problèmes de sciences naturelles. Par exemple, via le projet Open Catalyst , Facebook et CMU recherchent de nouvelles façons de stocker l'énergie solaire et éolienne renouvelable. Une solution possible est de convertir cette énergie par des réactions chimiques en d'autres carburants, par exemple l'hydrogène. Mais pour cela, il est nécessaire de créer de nouveaux catalyseurs pour des réactions chimiques de haute intensité, et les méthodes connues aujourd'hui comme le DFT sont très coûteuses. Les auteurs du projet ont publiéla plus grande collection de catalyseurs, de désintégrations DFT et de lignes de base pour les réseaux de neurones graphiques. Les développeurs espèrent trouver de nouvelles simulations moléculaires à faible coût qui complètent les simulations coûteuses actuelles qui se déroulent sur plusieurs jours avec des estimations efficaces de l'énergie et des forces intermoléculaires calculées en quelques millisecondes.

Les chercheurs de DeepMind ont également utilisé des réseaux de neurones graphiques pour émuler la dynamique de systèmes de particules complexes tels que l'eau et le sable. En prédisant le mouvement relatif de chaque particule à chaque étape, on peut recréer de manière plausible la dynamique de l'ensemble du système et en apprendre davantage sur les lois régissant ce mouvement. Par exemple, c'est ainsi qu'ils essaient de résoudre le plus intéressant des problèmes non résolus dans la théorie des solides - le passage à l'état vitreux... Les réseaux de neurones graphiques vous permettent non seulement d'émuler la dynamique lors d'une transition, mais vous aident également à mieux comprendre comment les particules s'influencent mutuellement en fonction du temps et de la distance.

Le laboratoire de physique américain Fermilab travaille sur l' utilisation de réseaux de neurones graphiques au Grand collisionneur de hadrons pour traiter des millions de données et trouver celles qui pourraient être associées à la découverte de nouvelles particules. Les auteurs souhaitent implémenter des réseaux de neurones graphiques dans des circuits intégrés logiques programmables et les intégrer dans des processeurs pour la collecte de données , afin que les réseaux neuronaux graphiques puissent être utilisés à distance de n'importe où dans le monde. En savoir plus sur leur application en physique des hautes énergies dans cette étude .

Développement de médicaments

Les sociétés pharmaceutiques recherchent activement de nouvelles méthodes de développement de médicaments, se livrent une concurrence féroce entre elles et dépensent des milliards de dollars en recherche. En biologie, les graphiques peuvent être utilisés pour représenter des interactions à différents niveaux. Par exemple, au niveau moléculaire, les liaisons entre les nœuds dénoteront des forces interatomiques dans une molécule, ou des interactions entre des bases d'acides aminés dans une protéine. À plus grande échelle, les graphiques peuvent représenter les interactions entre les protéines et l'ARN ou les produits métaboliques. Selon le niveau d'abstraction, les graphiques peuvent être utilisés pour l'identification ciblée, la prédiction des propriétés moléculaires, le criblage à haut débit, la conception de nouveaux médicaments, la conception de protéines et la réutilisation des médicaments.

Le résultat probablement le plus prometteur de l'utilisation des réseaux de neurones graphiques dans ce domaine est le travail des chercheurs du MIT, publié dans Cell en 2020. Ils ont appliqué un modèle d'apprentissage en profondeur appelé Chemprop , qui a prédit les propriétés antibiotiques des molécules: inhiber la prolifération d'E. Coli. Après une formation sur seulement 2500 molécules d'une bibliothèque approuvée par la FDA, Chemprop a été appliqué à un ensemble de données plus grand, y compris un hub de réutilisation de médicaments contenant une molécule d' halicine renommée après le AI HAL 9000du film "A Space Odyssey 2001". Il est à noter qu'avant cela, l'halicine n'était étudiée qu'en relation avec le traitement du diabète, car sa structure est très différente des antibiotiques connus. Mais des expériences cliniques in vitro et in vivo ont montré que l'halicine est un antibiotique à large spectre. Une comparaison approfondie avec des modèles de réseaux de neurones puissants a mis en évidence l'importance des propriétés de l'halicine découvertes à l'aide de réseaux de neurones graphiques. En plus du rôle pratique de ce travail, l'architecture Chemprop est intéressante pour les autres: contrairement à de nombreux réseaux de neurones graphiques, elle contient 5 couches et 1600 dimensions cachées, ce qui est bien plus que les paramètres typiques des réseaux neuronaux graphiques pour de telles tâches. J'espère que ce n'était qu'une des rares découvertes de l'IA dans la future nouvelle médecine. En savoir plus sur cette direction iciet ici .

Quand les réseaux de neurones graphiques sont devenus une tendance

Les plongements de graphiques ont culminé en 2018, lorsque les modèles d'imbrication structurelle et de réseau de neurones graphiques proposés en 2016 ont été testés dans de nombreuses applications pratiques et ont montré une grande efficacité, y compris l'exemple le plus célèbre du modèle PinSAGE utilisé dans les recommandations du réseau social Pinterest. Depuis, la croissance des recherches sur ce sujet est devenue exponentielle, et il y a de plus en plus d'applications dans des domaines où auparavant les méthodes n'étaient pas capables de prendre en compte efficacement la communication entre objets dans les modèles. Il est à noter que l'automatisation de l'apprentissage automatique et la recherche de nouvelles architectures de réseaux de neurones efficaces ont également reçu un nouvel élan de développement grâce aux réseaux de neurones graphiques.

Sont-ils aussi une tendance en Russie?

Malheureusement, dans la plupart des cas, la Russie est en retard sur la recherche moderne dans le domaine de l'intelligence artificielle. Le nombre d'articles dans des conférences internationales et dans des revues de premier plan est d'un ordre de grandeur inférieur à celui des articles de scientifiques des États-Unis, d'Europe et de Chine, et le soutien financier à la recherche dans de nouveaux domaines rencontre une résistance dans l'environnement ossifié des universitaires qui sont coincés dans approches du siècle dernier et accordent des subventions plutôt sur le principe du népotisme gérontocratique que sur de véritables réalisations. En conséquence, lors de conférences de premier plan telles que TheWebConf, ICDM, WSDM, KDD, NIPS, les noms des scientifiques russes sont principalement affiliés aux universités occidentales, ce qui reflète la tendance à l'exode des cerveaux, ainsi que la concurrence sérieuse des pays avancés dans le domaine. du développement de l'IA, en particulier la Chine. ...

Si vous regardez les conférences dans le domaine de l'informatique avec la note A * la plus élevée selon Core, par exemple les conférences sur le calcul haute performance, la taille moyenne des subventions pour les articles acceptés dans la voie principale est de 1 million de dollars, ce qui perd à le maximum de programmes de la fondation scientifique russe en 15 à 30 fois. Dans de telles conditions, les recherches menées dans de grandes entreprises avec une organisation R&D sont en effet les seuls moteurs de la recherche de nouvelles approches basées sur les réseaux de neurones graph.

En Russie, la théorie des réseaux de neurones graphiques est étudiée à l'École supérieure d'économie sous ma direction, il y a aussi des groupes à Skoltech et au MIPT, la recherche appliquée est menée à l'ITMO, à l'Université fédérale de Kazan, ainsi qu'au laboratoire d'IA de Sber , dans des projets de R&D JetBrains, Mail.ru Group, Yandex.

Sur la scène mondiale, les pilotes sont Twitter, Google, Amazon, Facebook, Pinterest.

Tendance éphémère ou à long terme?

Comme toutes les tendances, la mode des réseaux de neurones graphiques a cédé la place aux transformateurs avec leurs grandes architectures décrivant toutes les dépendances possibles dans des données non structurées, mais générant des modèles qui coûtent des millions de dollars à former et ne sont disponibles que pour les méga-entreprises. Les réseaux de neurones graphiques ont non seulement réussi à prendre leur place en tant que norme pour la construction de l'apprentissage automatique sur des données structurelles, mais se sont également révélés être un moyen efficace d'attirer l'attention structurelle dans des industries connexes, y compris une efficacité élevée dans les problèmes d'apprentissage multi-exemples et l'apprentissage métrique. . Je suis sûr que c'est grâce aux réseaux de neurones graphiques que nous obtiendrons de nouvelles découvertes en science des matériaux, en pharmacologie et en médecine. Peut-être y aura-t-il de nouveaux modèles plus efficaces pour le Big Data qui ont les propriétés de transférer des connaissances entre différentes données graphiques.Les modèles permettront de surmonter les problèmes d'applicabilité des graphiques, dont la structure est opposée à la similitude des fonctionnalités, mais en général, ce domaine de l'apprentissage automatique est devenu une science indépendante, et il est temps de s'y plonger maintenant, c'est une chance rare de participer au développement d'une nouvelle industrie, à la fois dans la science et dans les applications industrielles.

Si vous souhaitez améliorer vos compétences en machine learning et étudier les réseaux de neurones graphiques, nous vous attendons dans notre MADE Big Data Academy .

Que sont les réseaux de neurones graphiques