Reformer - Transformateur efficace



Comprendre les donnĂ©es organisĂ©es sĂ©quentiellement - qu'il s'agisse de la langue, de la musique ou de la vidĂ©o - est difficile, en particulier lorsqu'elles dĂ©pendent fortement du contexte qui les entoure. Par exemple, si une personne ou un objet disparaĂźt du champ de vision de la vidĂ©o et rĂ©apparaĂźt aprĂšs une pĂ©riode de temps significative, de nombreux modĂšles oublieront Ă  quoi il ressemblait. Dans le domaine du traitement du langage, les rĂ©seaux de neurones Ă  mĂ©moire Ă  long terme (LSTM ) fournissent un contexte suffisant pour rĂ©ussir Ă  traduire phrase par phrase . Dans ce cas, la fenĂȘtre contextuelle (c'est-Ă -dire la couverture des donnĂ©es que le modĂšle prend en compte lors de la traduction) peut contenir de dix Ă  cent mots. Nouveau modĂšle de transformateura non seulement amĂ©liorĂ© la qualitĂ© de la traduction consĂ©cutive, mais peut ĂȘtre utilisĂ© pour gĂ©nĂ©rer des articles entiers de WikipĂ©dia en rĂ©sumant plusieurs documents. Ceci est possible car le Transformer a agrandi la fenĂȘtre contextuelle Ă  mille mots. De plus, un contexte aussi vaste permet d'utiliser le Transformer pour traiter non seulement du texte, mais aussi des pixels ou des notes de musique, Ă  partir desquels des images ou de la musique peuvent ĂȘtre gĂ©nĂ©rĂ©es .



. , . , 100 , 100 100 , 10 , . . , , ( – ). , , , .



Reformer – , 1 16 . Reformer , : (locality-sensitive-hashing, LSH), , (reversible residual layers) .





, – ? LSH : , , -, . , , ( ), . , . , , , , – (chunks), . ( ) , .



image3



: Reformer , ( , ), . LSH , . .





LSH , . GPU, , , . , . , .



, Reformer', : , , . , , . , . , , . , , ; . , , , .



image4



: (a) . (b) , . () , .



Reformer'



Reformer' , 1 16 . , Reformer , . , Reformer' .



, – . Colab- Reformer' . , , Reformer (. ).



image5



: , Reformer'. : «» . Imagenet64.



Reformer' , . Reformer . , Colab- « ». , , , Reformer, .





, Reformer , . , , Reformer', . , . , Reformer'. Colab– , .





  • — Nikita Kitaev, Ɓukasz Kaiser
  • —
  • —



All Articles