Comment l'intelligence artificielle a appris à résoudre la diffusion

Aujourd'hui, à la veille du début d'un nouveau volet du cours "Mathématiques et apprentissage automatique pour la science des données" , nous partageons avec vous une traduction utile d'un article du MIT Technology Review sur la façon dont les chercheurs de Koltech ont enseigné à l'IA pour résoudre des équations aux dérivées partielles, pourquoi elle est nécessaire et comment elle peut changer le monde ... Vous pouvez trouver tous les détails sous la coupe.










À moins d'être physicien ou ingénieur, vous avez peu de raisons de connaître les équations aux dérivées partielles. Et après des années d'études supérieures en génie mécanique, je ne les ai plus utilisées dans la vraie vie depuis.



Mais de telles équations (ci-après nous utilisons l'abréviation anglaise PDE pour simplifier), ont leur propre magie. Il s'agit d'une catégorie d'équations mathématiques qui sont vraiment bonnes pour décrire les changements dans l'espace et le temps, et donc très pratique pour décrire les phénomènes physiques dans notre univers. Ils peuvent être utilisés pour tout modéliser, des orbites planétaires à la tectonique des plaques et à la turbulence de l'air interférant avec le vol, ce qui nous permet à son tour de faire des choses utiles, comme prédire l'activité sismique et concevoir des avions sûrs.



Le hic, c'est que les PDE sont notoirement difficiles à résoudre. Et ici, le sens du mot «décision» est peut-être mieux illustré. Par exemple, vous essayez de simuler la turbulence de l'air afin de tester une nouvelle conception d'avion. Il existe une PDE bien connue appelée l'équation de Navier-Stokes, qui est utilisée pour décrire le mouvement de tout fluide. La résolution de l'équation de Navier-Stokes vous permet de prendre un «instantané» du mouvement de l'air (conditions de vent) à tout moment et de simuler comment il continuera à se déplacer ou comment il se déplaçait auparavant.



Ces calculs sont très complexes et coûteux en calcul, de sorte que les disciplines avec beaucoup de PDE s'appuient souvent sur des supercalculateurs pour effectuer des calculs mathématiques. C'est pourquoi les professionnels de l'IA s'intéressent particulièrement à ces équations. Si nous pouvions utiliser l'apprentissage en profondeur pour accélérer la solution, il pourrait y avoir de nombreux avantages dans la recherche et l'ingénierie.



Les chercheurs de Koltech présentent une nouvelle technique d' apprentissage en profondeurpour résoudre le PDE, qui est nettement plus précis que les méthodes d'apprentissage en profondeur développées précédemment. La méthode est également suffisamment généralisée pour résoudre des familles entières de PDE telles que l'équation de Navier-Stokes pour tout type de fluide, sans avoir besoin d'une nouvelle formation. Enfin, il est 1 000 fois plus rapide que les formules mathématiques traditionnelles, ce qui réduit la dépendance aux supercalculateurs et augmente encore la puissance de calcul de la modélisation de problèmes. Et c'est bien. Donnez deux!



Temps de marteau



[environ. trad. - Sous-titre - un clin d'œil à "U Can't Touch This" du rappeur MC Hammer]



Avant de nous plonger dans la manière dont les chercheurs l'ont fait, évaluons d'abord les résultats. Le gif ci-dessous montre une démo impressionnante. La première colonne montre deux instantanés du mouvement fluide; la deuxième colonne montre comment le fluide a continué à se déplacer; et la troisième colonne montre la prédiction du réseau neuronal. Fondamentalement, il semble identique au second.







L'article a fait beaucoup de bruit sur Twitter et même le rappeur MC Hammer a republié.







Mais revenons à la façon dont les scientifiques y sont parvenus.



Quand la fonction s'adapte



La première chose à comprendre est que les réseaux de neurones sont essentiellement des approximateurs. Lorsqu'ils s'entraînent sur un ensemble d'entrées et de sorties, ils calculent en fait une fonction ou une série d'opérations mathématiques qui traduisent une donnée en une autre. Pensez à un détecteur de chat. Vous entraînez le réseau de neurones en lui fournissant de nombreuses images de chats et d'autres images, en indiquant les groupes comme 1 et 0. Ensuite, le réseau de neurones recherche la meilleure fonction qui convertit chaque image du chat en 1 et les images de tout le reste en 0. Ainsi, le réseau peut regarder l'image et dire s'il y a un chat dessus. Elle utilise la fonction trouvée pour calculer sa réponse, et si la formation a réussi, dans la plupart des cas, la reconnaissance sera correcte.



De manière pratique, l'approximation des fonctions est exactement ce dont nous avons besoin pour résoudre la PDE. En fin de compte, vous devez trouver une fonction qui décrit le mieux, par exemple, le mouvement des particules d'air dans l'espace et le temps.



Telle est l'essence du travail. Les réseaux de neurones sont généralement formés pour approximer les fonctions entre les entrées et les sorties définies dans l'espace euclidien, il s'agit d'un graphe classique avec les axes x, y et z. Mais cette fois, les chercheurs ont décidé de définir les entrées et les sorties dans l'espace de Fourier - un type spécial d'espace pour tracer les fréquences d'onde. Le fait est que quelque chose comme le mouvement de l'air peut en fait être décrit comme une combinaison de vagues, explique Anima Anandkumar, professeur à l'Université de Californie qui, avec ses collègues, les professeurs Andrew Stewart et Kaushik Bhattacharya, a dirigé la recherche. La direction générale du vent au niveau macro est similaire à la basse fréquence avec des vagues très longues et lentes, tandis que les petits tourbillons qui se forment au niveau micro sont similaires aux hautes fréquences avec des vagues très courtes et rapides.



Pourquoi est-ce si important? Parce qu'il est beaucoup plus facile d'approcher une fonction de Fourier dans l'espace de Fourier que de traiter PDE dans l'espace euclidien. Cette approche simplifie grandement le travail du réseau de neurones. C'est aussi une garantie d'améliorations significatives de la précision: en plus de l'énorme avantage de vitesse par rapport aux méthodes traditionnelles, la nouvelle méthode réduit le taux d'erreur dans la résolution des problèmes de Navier-Stokes de 30% par rapport aux précédentes méthodes d'apprentissage en profondeur.



Tout cela est très raisonnable, et en plus, la méthode a la capacité de se généraliser. Les méthodes précédentes d'apprentissage en profondeur doivent être formées séparément pour chaque type de fluide, dans le cas de cette méthode, une formation suffit pour faire face à tous les fluides, ce qui est confirmé par les expériences des chercheurs. Bien qu'ils n'aient pas encore tenté d'étendre l'approche à d'autres médias, la méthode devrait également être capable de travailler avec la croûte terrestre lors de la résolution des PDE liés aux séismes ou avec des types de matériaux lors de la résolution des PDE liés à la conductivité thermique.



Supersimulation



Les professeurs et leurs étudiants diplômés ont fait cette recherche pour plus que le plaisir des théories. Ils veulent amener l'IA dans de nouvelles disciplines scientifiques. C'est grâce à des conversations avec des employés de différents profils travaillant dans les domaines de la climatologie, de la sismologie et de la science des matériaux qu'Anandkumar a été la première à résoudre le problème du PDE avec ses collègues et étudiants. Ils travaillent actuellement à la mise en pratique de la méthode avec des collègues chercheurs du Coltech et du Lawrence Berkeley National Laboratory.



L'un des sujets de recherche particulièrement préoccupants pour Anandkumar est le changement climatique. L'équation de Navier-Stokes est bien adaptée non seulement pour simuler la turbulence de l'air; cette équation est également utilisée dans la modélisation météorologique. «Faire des prévisions météorologiques mondiales fiables et précises est un défi», dit-elle, «et même sur les plus gros supercalculateurs, nous ne pouvons pas faire de prévisions mondiales aujourd'hui.» Par conséquent, si nous pouvons utiliser une nouvelle méthode pour accélérer tout le travail, cela aura un impact énorme.



«Il existe de très nombreuses autres applications de la méthode», ajoute-t-elle. "En ce sens, il n'y a pas de limite, car nous avons un moyen commun d'accélérer le travail avec toutes ces applications."



L'intelligence artificielle est désormais capable de résoudre la diffusion, quelle est la prochaine étape? Vous ferez peut-être partie de ceux qui lui apprendront à résoudre des problèmes encore plus complexes.

Et nous serons heureux de vous aider avec cela en présentant un code promo spécial HABR , qui ajoutera 10% à la réduction de la bannière.



image




Plus de cours




Articles recommandés






All Articles