Détection rapide des supernovae à l'aide de réseaux de neurones

Bonjour, Habr! Je voudrais vous présenter une traduction (légèrement adaptée) de l'excellent article "Détection rapide de supernovae à l'aide de réseaux de neurones" de Rodrigo Carrasco-Davis de l'Institut d'astrophysique du Chili.



Un peu de contexte



L'astronomie est l'étude des objets célestes: étoiles, galaxies ou trous noirs. Cette étude des objets célestes ressemble au travail du laboratoire de «physique naturelle». Les processus naturels les plus incroyables et les plus extrêmes s'y déroulent, qui pour la plupart ne peuvent pas être répétés sur Terre. Les observations de ces processus nous permettent d'acquérir une compréhension plus profonde du monde, de vérifier les connaissances existantes sur la physique, de comparer les idées établies avec ce que nous observons dans l'Univers.



Il existe un type particulier d'événement qui présente un grand intérêt pour les astronomes. Cela arrive à la fin de la vie d'étoiles massives. Ils sont composés d'hydrogène, qui est tiré vers le centre par gravité. Et lorsque la densité devient suffisamment élevée, les atomes d'hydrogène commencent à fusionner. Cela conduit à l'apparition d'une lueur et à l'apparition de nouveaux éléments chimiques: hélium, carbone, oxygène, néon, etc. Le processus de fusion se déroule sous pression interne, tandis que la gravité exerce une pression externe, maintenant ainsi la stabilité de l'étoile pendant qu'elle s'épuise. Plus l'étoile est massive, plus les températures atteignent son noyau et plus vite elle brûle le combustible nucléaire.



Peu à peu, le processus de synthèse passe aux éléments plus lourds: au magnésium, au silicium, au soufre, pour finalement arriver au fer, au cobalt et au nickel. La synthèse d'autres éléments nécessiterait plus d'énergie que celle libérée pendant la réaction, de sorte que le noyau s'effondre et une explosion de supernova se produit.





Nébuleuse du crabe , vestige de supernova



Ce processus est très important pour les astronomes. En raison des conditions extrêmes lors de l'explosion, les astronomes peuvent observer la synthèse d'éléments lourds, vérifier le comportement de la matière sous une pression et une température intenses, et observer le produit de l'explosion, qui pourrait être une étoile à neutrons ou un trou noir.



Les supernovae peuvent également être utilisées comme bougies standard. Un problème courant en astronomie: mesurer les distances par rapport aux objets célestes. Les étoiles étant si éloignées de la Terre, il est difficile de déterminer si une étoile est faible et proche de nous, ou très éloignée et très brillante. La plupart des explosions de supernova dans l'univers se produisent de la même manière, c'est pourquoi les astronomes utilisent des supernovae pour mesurer les distances, ce qui est important lors de l'étude, par exemple, de l'expansion de l'univers et de l'énergie sombre .



Malgré le fait que les explosions de supernova sont très brillantes, elles sont difficiles à remarquer en raison de leur éloignement de la Terre, en raison de leur faible fréquence d'occurrence (environ une supernova par galaxie et par siècle) et de la nature à court terme de l'explosion, qui peut durer de plusieurs jours à quelques jours. semaines. De plus, afin d'obtenir des informations utiles à partir d'une supernova, il est nécessaire de préparer un spectrographe (utilisé pour mesurer l'énergie émise lors d'une explosion à plusieurs fréquences). Il serait également bon de commencer à observer l'étoile à l'avance, car de nombreux processus physiques intéressants se déroulent dans les heures suivant l'explosion. Maintenant, posez-vous la question: comment pouvons-nous trouver rapidement ces explosions de supernova parmi tous les autres objets astronomiques observables dans l'univers?



L'astronomie aujourd'hui



Il y a plusieurs décennies, un astronome devait sélectionner un objet spécifique et pointer un télescope vers lui pour obtenir les informations dont il avait besoin. Des télescopes modernes comme le Zwicky Transient Facility (ZTF) ou l'Observatoire Vera Rubin capturent des images du ciel de haute qualité à très grande vitesse, collectant des données sur le ciel visible tous les trois jours. Le télescope ZTF génère 1,4 To de données par nuit, identifiant et envoyant des informations sur des objets changeants intéressants dans le ciel en temps réel.



Lorsque quelque chose change de luminosité, les télescopes "intelligents" le remarquent et envoient une alerte d'avertissement. L'avertissement est accompli en envoyant un flux de données dans lequel chaque message se compose de trois images recadrées de 63 par 63 pixels. Ces trois images sont appelées scientifiques, de référence et différentielles.



Un fichier d'image scientifique est l'observation la plus récente d'une zone spécifique. Avec référence - ce qui était au début des observations. Tout ce qui a changé entre la première et la deuxième image peut être vu dans la troisième, la différence. Le célèbre télescope transmet jusqu'à un million d'avertissements par nuit, mais le plus souvent plusieurs milliers. Disons qu'une personne souhaite vérifier chaque alerte manuellement, il faudra environ 3,5 jours pour afficher toutes les alertes en une nuit.





Images scientifiques, de référence et de différence. Complété avec d'autres données importantes, telles que les conditions d'observation et des informations sur l'objet. La quatrième image est une version couleur de PanSTARRS utilisant l' Aladin Sky Atlas . Vous pouvez voir l'évolution complète de la luminosité des supernova au fil du temps dans l'interface ALeRCE .



Puisque ces avertissements communiquent tout ce qui change dans le ciel, il est important de pouvoir détecter les supernovae parmi tout le flux d'informations généré par le télescope. Le problème est que d'autres objets astronomiques peuvent également déclencher une alerte. Par exemple, des étoiles variables changeant de luminosité, des noyaux galactiques actifs, astéroïdes. Il y a aussi de faux avertissements. Heureusement, les images scientifiques, de référence et de différence ont un certain nombre de caractéristiques distinctives qui aident à déterminer ce qu'une alerte parle d'une supernova ou d'un autre objet. Et ce serait formidable d'apprendre à distinguer efficacement les principales classes d'alertes.





Cinq classes d'objets astronomiques



Ainsi, les noyaux galactiques actifs sont généralement situés au centre des galaxies. Les supernovae proviennent généralement près de la galaxie hôte. Les astéroïdes sont observés à proximité du système solaire et ne sont pas visibles sur l'image de référence. Les étoiles variables se trouvent dans des images remplies d'autres étoiles car elles se trouvent principalement dans la Voie lactée. Les fausses alertes surviennent pour diverses raisons: manque de pixels dans la caméra du télescope, mauvaise soustraction lors de la création d'une image différentielle, rayons cosmiques, etc. Comme je l'ai déjà dit, il n'est pas possible pour un humain de vérifier manuellement chaque avertissement. Par conséquent, un moyen automatique de les classer était nécessaire afin que les astronomes puissent trouver les données les plus intéressantes, qui sont plus susceptibles de contenir des informations sur les supernovae.



Recherche de supernovae à l'aide de réseaux de neurones



Puisque nous comprenons grossièrement les différences entre les images des cinq classes mentionnées ci-dessus, nous pouvons essayer de calculer des caractéristiques spécifiques afin de les classer correctement. Cependant, le travail manuel est difficile et nécessite une longue période d'essais et d'erreurs. Par conséquent, il a été décidé de former un réseau de neurones convolutifs (CNN) pour résoudre le problème de classification et détecter rapidement les supernovae.



Assurer l'invariance du réseau neuronal est obtenue en créant des copies pivotées de chaque image dans l'ensemble d'apprentissage de 90 °, après quoi la valeur moyenne de chaque version pivotée de l'image est chargée. L'utilisation de l'invariance est importante car il n'y a pas d'orientation spécifique dans laquelle les structures peuvent apparaître dans les images envoyées dans les alertes.



Les scientifiques ont également ajouté certaines des métadonnées contenues dans l'avertissement, telles que la position dans les coordonnées du ciel, la distance par rapport à d'autres objets connus et les mesures des conditions atmosphériques. Après avoir entraîné le modèle à l'aide de l'entropie croisée, la probabilité que l'avertissement contienne des informations sur une supernova se concentre autour des valeurs de 0 ou 1. Il est vrai que le classificateur a parfois commis des erreurs dans la classe prédite. Il n'est pas très pratique que le chercheur doive filtrer en plus les données sur d'éventuelles supernovae après que l'ordinateur a fait une prédiction.



Pour maximiser l'entropie de la prévision et distribuer les valeurs des probabilités de sortie, les scientifiques ont ajouté des informations supplémentaires au réseau neuronal. Cela a permis d'améliorer le détail ou la clarté des prévisions, en obtenant des probabilités dans toute la gamme de 0 à 1, et pas seulement les valeurs extrêmes de ces indicateurs. Le résultat est des prédictions beaucoup plus facilement interprétables, permettant à l'astronome de choisir des candidats supernovae debout.





Réseau neuronal convolutif avec invariance de rotation accrue. Des copies pivotées sont créées et transmises à la même architecture de réseau neuronal pour ensuite appliquer le pool intermédiaire dans une couche dense avant de les combiner avec des métadonnées.



Les scientifiques ont parcouru le réseau de neurones environ 400 000 objets, répartis uniformément dans l'espace sur toute la couverture du télescope ZTF, pour vérifier l'exactitude des prévisions du modèle. Il s'est avéré que chaque classe prédite par le réseau de neurones est spatialement distribuée. Cela a du sens quand on considère la nature de chaque objet astronomique. Par exemple, les noyaux et supernovae galactiques actifs sont pour la plupart en dehors du plan de la Voie lactée (objets extragalactiques), car il est peu probable que d'autres objets puissent être vus à travers le plan de la Voie lactée en raison de l'occlusion. Le modèle prédit correctement moins d'objets près du plan de la Voie lactée (latitudes galactiques plus proches de 0). Les étoiles variables sont correctement détectées avec une densité plus élevée dans le plan galactique. Les astéroïdes sont situés près du plan du système solaire,également appelé l'écliptique (marqué d'une ligne jaune). Et de faux avertissements se produisent partout.



L'information contenue dans les images (scientifique, référence et différence) est suffisante pour obtenir une bonne classification dans l'ensemble d'apprentissage, mais l'intégration des informations des métadonnées était essentielle pour obtenir la distribution spatiale correcte des prédictions. 





Distribution spatiale d'un ensemble non marqué d'objets astronomiques. Chaque graphique est donné en coordonnées galactiques. La latitude galactique est au centre de la Voie lactée, donc les latitudes proches de 0 sont également plus proches du plan de la Voie lactée. La longitude galactique indique la quantité de disque que nous voyons dans le plan de la Voie lactée. La ligne jaune représente le plan du système solaire (écliptique).



Chasseurs de supernova



L'interface Web du projet Supernova Hunter qui en résulte permet aux astronomes d'étudier des objets sélectionnés par le réseau neuronal, convaincus qu'il s'agit de supernovae. Ils peuvent également signaler les erreurs de classification effectuées par le modèle, ce qui permet d'ajouter de nouvelles informations à l'ensemble d'entraînement pour améliorer les performances du réseau neuronal ultérieurement.





Supernova Hunter : interface utilisateur pour la recherche de candidats supernova. Il affiche une liste d'alertes avec une forte probabilité d'informations sur les supernovae. Pour chacun d'eux, des images, la position de l'objet et des métadonnées sont ajoutées.



Le classificateur de réseau neuronal et Supernova Hunter ont confirmé 394 supernovae et signalé 3060 candidats de supernova sur Transient Name ServerDu 26 juin 2019 au 21 juillet 2020, en moyenne, il y avait 9,2 candidats supernova par jour. Ce taux d'observation augmente considérablement le nombre de supernovae disponibles qui peuvent être étudiées aux premiers stades d'une explosion.



Points de vue



Les scientifiques à l'origine du Supernova Hunter travaillent maintenant à améliorer les caractéristiques de classification du modèle afin qu'il identifie plus précisément les candidats de supernova et nécessite moins d'attention humaine. Idéalement, il devrait s'agir d'un système capable de signaler automatiquement tous les candidats potentiels de supernova avec un degré élevé de confiance.



Un autre domaine de travail des scientifiques est la recherche d'objets rares à l'aide de méthodes de détection des valeurs aberrantes. C'est une tâche difficile mais réaliste, car de nouveaux télescopes pourraient théoriquement découvrir de nouveaux types d'objets astronomiques en raison de l'incroyable taux d'échantillonnage et de l'échelle de chaque observation.



Une nouvelle façon d'analyser d'énormes quantités de données astronomiques sera non seulement utile, mais également nécessaire, car l'organisation de la classification et de la redistribution des données est une partie importante de la science. L'utilisation des puissants télescopes d'aujourd'hui change fondamentalement la façon dont les astronomes étudient les objets célestes, et les scientifiques doivent être prêts à travailler avec les nouvelles technologies.



Merci de votre attention! Article original .



All Articles