Modèle de reconnaissance du degré d'atteinte pulmonaire au scanner: nous avons considérablement augmenté la précision du triage des patients

image

CT scan avec des zones de verre dépoli Les



patients avec COVID-19 confirmé subissent une tomodensitométrie des poumons. Si vous avez de la chance - une fois, sinon - plusieurs fois. Pour la première fois, vous devez estimer le niveau de dommage en pourcentage. Selon le quartile du degré de dommage, le schéma de traitement ultérieur est déterminé, et ils sont très différents. En avril 2020, nous avons appris qu'il y avait deux difficultés:



  • CT est une image en trois dimensions, chaque couche d'une telle image est appelée une tranche. Avec 300 à 800 coupes pulmonaires en TDM, les médecins passent 1 à 15 minutes à rechercher des zones caractéristiques pour déterminer l'étendue de la lésion. Une minute est "à l'œil nu", 30 minutes est la moyenne pour la sélection manuelle et le comptage des zones de tissu endommagé. Dans les cas difficiles, le résultat peut être traité jusqu'à une heure.
  • La précision du diagnostic du niveau d'infection à coronavirus par des experts «à l'œil nu» est élevée aux frontières de 0-30% et 70-100%. Entre 30 et 70, l'erreur est très élevée et nous avons remarqué que certains radiologues surestiment en règle générale systématiquement le pourcentage de lésions par œil, tandis que d'autres sous-estiment.


La tâche est réduite à déterminer le tissu endommagé des poumons et à calculer la proportion de leur volume par rapport au total des poumons.



Fin avril, en coopération avec des cliniques, nous avons préparé un ensemble de données d'études anonymisées de patients avec une analyse PCR confirmée du COVID-19, avons donné un comité de dix excellents radiologues experts et cartographié un échantillon pour la formation avec un enseignant.



Il y a eu une version bêta fin mai. En juillet, il y avait un modèle prêt à l'emploi pour divers types d'équipements de tomodensitométrie utilisés en Russie. Nous sommes une équipe du laboratoire d'intelligence artificielle de la Sberbank. En général, nous publions nos développements dans la littérature scientifique (MICCAI, AIME, BIOSIGNALS), et nous en parlerons même sur AI Journey.



Pourquoi c'est important



Les radiologues ont déjà reçu des files d'attente fin avril. C'était important:



  • Augmentez le débit de points avec les examens CT.
  • Augmentez la précision de la recherche en second lieu.
  • Permettre de voir avec précision le changement du niveau de lésion entre les images d'un patient (et cela peut être de quelques pour cent, il est important de comprendre s'il est devenu plus ou moins).


De plus, dans la première vague, la situation s'est aggravée, car des radiologues expérimentés sont tombés malades et ont abandonné le processus. La précision et la vitesse ont chuté.



L'intelligence artificielle est bonne pour classer les données médicales. Une bonne hiérarchisation des patients sauve des vies, car plus nous déterminons avec précision le degré de blessure, plus il y a de chances qu'une personne gravement malade reçoive les médicaments nécessaires et (si tout va pire) une ventilation mécanique à temps. Et qu'une personne dont les poumons ne sont pas si gravement atteints ne prendra pas sa place à l'hôpital.



L'évaluation de la proportion de lésions est l'une des tâches les plus difficiles et les plus gourmandes en ressources pour une personne en diagnostic, car il est nécessaire d'évaluer un grand volume de foyers irréguliers, divisés en plusieurs sections.



La tâche elle-même



À l'entrée - tranches axiales d'une certaine épaisseur. Habituellement, les paramètres sont définis entre 0,5 mm et 2,5 mm. La cage thoracique est de 300 à 800 images 2D. Ils sont mis en correspondance approximative les uns avec les autres, c'est-à-dire qu'ils ont déjà été transformés de manière à ce que, conditionnellement, des images sur un film translucide d'une épaisseur donnée puissent être construites et qu'un modèle de la poitrine soit obtenu. Mais tout a longtemps été, bien sûr, sous forme numérique.



Les spectateurs peuvent afficher des scans CT par couches ou créer un modèle 3D. Les modèles ne sont pas très instructifs pour les médecins, car il est difficile de comprendre d'eux la localisation des foyers de ce type de lésion. Les professionnels utilisent souvent la reconstruction multiplanaire - ils affichent trois projections orthogonales - horizontale, frontale et sagittale. Puis, à leur tour, ils parcourent chaque axe le long des sections, à la recherche de ce qui est nécessaire. Cela se produit rapidement dans la pratique. Vous devez parcourir 500 de ces images trois fois:



image



différents médecins obtiennent des résultats différents en termes de pourcentage de dommages après un tel examen.



Il faut mesurer le volume du poumon dans la poitrine et y trouver toutes les consolidations, puis estimer leur volume. Dans le premier échantillon, nous avons pris 60 000 coupes CT reconstruites (l'appareil tire dans un axe, mais les projections nécessaires peuvent être obtenues à l'aide de transformations).



Nos dix médecins n'ont pas évalué à l'œil nu, mais ont sélectionné toutes les consolidations manuellement, en examinant soigneusement chaque section. Nous avons légèrement enrichi l'ensemble d'entraînement avec une augmentation - une combinaison d'étirements, de pressions, de rotations et de changements sur l'ensemble existant.



L'algorithme détermine la présence de consolidation pour chaque point. Le modèle de réseau de neurones utilisé est basé sur l'architecture U-Net publiée en 2016... L'avantage de l'architecture U-Net est que le réseau de neurones analyse les images originales à différentes échelles, ce qui permet aux couches convolutives de «regarder» des zones de l'image, dont la taille augmente de manière exponentielle à mesure que la profondeur du réseau de neurones augmente. En d'autres termes, chaque pli "regarde" une petite zone de 3 × 3 px. Ensuite, l'échelle est réduite de deux fois, puis de deux de plus: chaque convolution suivante regarde une zone de 3 × 3 pixels, mais derrière ces pixels se trouvent des parties de l'image, réduites plusieurs fois (6 × 6, 12 × 12, ...). L'ensemble final contient deux réseaux de neurones convolutifs de plus d'architecture similaire basés sur U-Net, avec une partie de «compression» plus lourde que dans l'article original.



Là où le réseau tourne mal, mais les médecins ne se trompent pas



Parfois, dans les images, il y a des soi-disant artefacts, que ce soit le résultat de la respiration ou du mouvement du corps. Dans ce cas, des zones présentant des caractéristiques similaires aux changements apparaissent sur les images, mais ce n'est pas une pathologie. Même si le modèle a identifié ces domaines, leur influence totale sur le résultat est de plusieurs dixièmes de pour cent et les décisions sont prises par quartiles, c'est-à-dire que le patient doit être classé dans l'une des quatre catégories en termes de degré de dommage. Par conséquent, nous avons négligé cette partie de la tâche. Il était beaucoup plus important de configurer le réseau pour chaque type d'équipement utilisé dans le pays.



Normalisation



Les tomographes écrivent des fichiers selon la norme DICOM, mais l'interprétation des formats standard et d'enregistrement peut être très différente, il a donc fallu beaucoup de temps et de nerfs pour conserver les fichiers écrits par toutes les machines de tomodensitométrie. En conséquence, nous avons également un outil pour réduire tous les fichiers DICOM à une seule norme et une seule forme, ce qui sera utile plus loin pour résoudre les problèmes de diagnostic, si nous les acceptons. Et pas seulement COVID-19.



Notre logiciel n'interfère pas avec le médecin, mais est installé en parallèle. Il dispose de ses outils habituels et de notre solution, qui montre une série supplémentaire avec un rapport analytique et une localisation des consolidations trouvées. Le rapport analytique ressemble à ceci:



image



Le logiciel est fourni par On-premise et est inclus dans le flux de travail de la clinique, fonctionnant avec les machines de tomodensitométrie et les postes de travail des médecins utilisant le protocole DICOM, est installé sur les serveurs de la clinique à l'intérieur d'un circuit protégé, un GPU puissant est nécessaire pour que le réseau neuronal fonctionne. Il existe également une solution cloud, car toutes les cliniques régionales ne peuvent pas se le permettre. Il existe des fonctionnalités avec le transfert de données médicales, vous devez être assuré d'être dépersonnalisé.



Pourquoi les fabricants de tomographes n'ont-ils rien fait?



Il peut sembler que nous sommes les seuls héros à avoir assumé la tâche. Non, il y avait d'autres approches. Le plus souvent, les fabricants de tomographes ont terminé le tri selon l'échelle de Hounsfield (densité tissulaire) et ont publié soit des plug-ins prêts à l'emploi, euh ... sous licence séparée, soit des directives sur la façon de définir les paramètres de sorte que seul un certain type de tissu soit vu. Cela a permis de mieux voir les consolidations (idéalement, seuls les tissus caractéristiques d'elles en termes de densité pour le flux de rayonnement sont restés dans le cadre), mais ne leur a toujours pas permis de compter automatiquement. De plus, le déverrouillage d'une telle fonctionnalité était souvent plus coûteux que plusieurs de nos implémentations et serveurs GPU pour eux.



Où voir plus de détails



Ici même .



Plus de détails .



All Articles