Première place à AI Journey 2020 Digital Peter

Salut Habr
Salut Habr

Bonne journée tout le monde! Le concours annuel international d'IA, organisé par la Sberbank avec des partenaires russes et étrangers, dans le cadre de la conférence Artificial Intelligence Journey , vient de se terminer récemment . Tâches de cette année: Digital Peter: reconnaissance des manuscrits de Peter I , NoFloodWithAI: inondations sur le fleuve Amour et AI 4 Humanities: ruGPT-3 . Cette fois, environ 1000 personnes de 43 pays ont participé au concours.





Notre équipe a participé à la résolution du problème "Digital Peter: reconnaissance des manuscrits de Peter I" et a remporté la première place. Je voudrais vous dire ce que nous avons fait dans le processus de résolution de la concurrence, qui est papa ici , quels trucs et astuces nous avons utilisés. Il y a beaucoup d'informations, il y aura beaucoup de mots spéciaux pour ceux qui ne sont pas dans le sujet. Ce n'est pas un tutoriel, je ne le décrirai pas en détail, mais je me ferai un plaisir de répondre aux questions dans les commentaires.





Vous pouvez regarder l'équipe de rêve





Plan

  • Description de la tâche





  • Étapes de la solution





    1. Prétraitement des données





    2. Description du réseau neuronal





    3. Augmentation





    4. CharMasks





    5. Correction orthographique avec XLMRoberta





    6. Ensemble + Seuils de correction orthographique





  • Ce qui n'a pas fonctionné





  • Équipe





  • Conclusion





Description de la tâche

Format des données, ressources disponibles et limites





, : , I, (. ). , , - .





.





, - , - , , .





500 , , , , .





1.

, ( OOF), . ( ), ( ), , +90, -90 . (Resnet34 ) . , .









, .. . .





2.

, CTCLoss Attention. CTCLoss , Attention . CTCLoss, , Attention . .





Bs - , (w, h, c) - (, , ). . Hidden size - LSTM . Dict Size - , . Dense - Keras, Linear PyTorch.





3.

, . : ToGray, CLAHE, Rotate, CutOut.





CutOut .  , HandWrittenBlots, , , .  , ( ) . CutOut , HandWrittenBlots .  Augmixations. .





P.S. CutOut , .





4. CharMasks

, , CTC Loss. , , , ( , ). ( Action Labeling ).





. , , . , . XVII-XVIII (, ). , , .





merci à tous pour conov piter
piter

, , , , . . , . . (Multi Word Expression) ( ) .





merci à tous pour conov piter
piter

, , .. , . - :





merci à tous pour conov piter
piter

5. Spell correction using XLMRoberta

, .





,     ( , ). NLP. XLMRoberta XVII-XVIII .., I. :





1. OCR ( ) ( ) ( + softmax), 3 (//blank ..) ;





2. : 3-4 , - .. //blank, , . zero-shot learning, , . OCR ('': 'p', '': 'o', '': 'e', '': 'c', '': 'a', '': 'x', '': 'u', '': ‘k’);





3. OCR step by step (!), ;





4. : ( 0 12), 50% padding ( ), 10% . ( ). XLMRoberta outputhiddenstates - NER, ;





5. GPU , TPU Colab





P.S.

( ), BeamSearch. .





6. Ensemble + Spell Correction Thresholds





, , , CTCLoss, . .    , . N "" . , , . . , , , ., +- .





Other Backbones. (EfficientNet, [SE, ECA]ResNet[xt], Mobilenet ), Resnet34.





Augmentations.   Albumentations (Brightness, Gamma, Blur ), , .





TTA (Test-Time Augmentations).  , holdout , public test - . , holdout.





Classic Blending.  , , , , , .





(). , ! :)





(github, linkedin, kaggle)





(github, linkedin, kaggle)





(github, linkedin, kaggle)





(linkedin, kaggle)





, , . , .





P.S. ( , public): 

| CER: 2.531 | WER: 13.5 | ACC: 62.107 | TIME: 32s |

submission .





P.P.S.

, ? :)












All Articles