Comment cela a-t-il pu arriver? (Depuis le 01/12/2020, les sous-titres YouTube n'ont pas été corrigés.)
Sténotype
Depuis plus de cent ans, les sténographes américains utilisent des appareils spéciaux avec un clavier minimal de 22 touches - deux touches pour chaque doigt pour minimiser les mouvements de la main:
il y a cent ans, le sténotype était une version de la machine à écrire, et chaque touche laissait une impression sur papier. Il n'y avait pas de chariot: après chaque "accord" d'une ou plusieurs touches simultanément appuyées, le papier défilait d'une ligne vers le bas. L'empreinte de chaque lettre était toujours au même endroit dans la ligne. Les touches P, R, S, T sont présentes en deux exemplaires chacune - sous la main gauche et sous la main droite.
Chaque "accord" et chaque ligne de l'impression correspond à une syllabe. Il n'y a pas d'intervalle entre les mots et les mots eux-mêmes sont transmis phonétiquement: sur l'imprimé ci-dessus, la phrase «Vous devriez être capable de lire ces mots courts» est transcrite . Comme il y a moins de touches que de lettres dans l'alphabet anglais, et encore plus que de sons dans la parole anglaise, un ingénieux système de "codage" est utilisé, par exemple [n] s'écrit PB, [l] HR, diphtongue [eɪ] ASU , etc. Avec ce codage, par exemple, le mot lueur enregistrée comme TKPWHRAOEPL - «accord » des onze renversements!
Après la réunion, le sténographe a dû s'asseoir et retaper sa transcription sur une machine à écrire ordinaire, car il est absolument impossible pour une personne non préparée de la lire. Dans l'exemple ci-dessus, l'expression "absolument cent pour cent" s'écrit SHRAOUT HRAOE WOPB HUPBD PERS, ce qui signifie [sljuːtliː wɒn hʌnd pɛrs] - les syllabes manquantes doivent être reconstruites en fonction du contexte, et les voyelles ne correspondent pas tout à fait à la transcription du dictionnaire. Il existe différents systèmes de notation et d'abréviation, de sorte que même les sténographes eux-mêmes ont du mal à lire les notes de chacun. Voici un court extrait d'un manuel de sténographie qui a été édité par le propriétaire pour un système différent:
On pense que le taux moyen de discours en anglais est de 130 mots par minute, et un sténographe sténotypé peut taper jusqu'à 300 mots par minute, ce qui vous permet d'enregistrer la conversation même lorsque les interlocuteurs s'interrompent. Il existe un système Velotype similaire , axé sur la lettre par lettre plutôt que sur la phonétique; il vous permet de taper jusqu'à 200 mots par minute. La différence est due au fait que les mots anglais ont presque toujours plus de lettres que de sons - parfois deux fois, comme dans les mots choisissez [tʃuːz] ou terre[ɜːθ]. Velotype a été créé en 1939 lorsque les tabulateurs et le traitement automatique des données ont prospéré; La motivation pour écrire lettre par lettre était une transcription plus simple qui pouvait même être confiée à une machine électromécanique. Avec d'autres équipements de bureau, les machines sténographiques elles-mêmes ont été électrifiées: au lieu de clés connectées mécaniquement et de lettres imprimées sur papier, l'électronique, des affichages pratiques, le stockage numérique et le traitement des transcriptions ont été utilisés depuis la fin du siècle dernier.
Au début de ce siècle, les capacités de traitement informatisé du langage naturel ont atteint le niveau de déchiffrement automatique des transcriptions phonétiques sténotypiques et de transformation de «SHRAOUT HRAOE» en «absolument». Ensuite, l'accompagnement des personnes handicapées a atteint le niveau des chaînes de télévision accompagnant la diffusion en direct avec des sous-titres en temps réel pour ceux qui trouvent plus facile à lire qu'à écouter. Cela signifie que l'émission est surveillée par un sténographe avec un sténotype, il enregistre le discours de l'annonceur et des autres participants à l'émission, son ordinateur transcrit la transcription, si nécessaire, la traduit automatiquement dans la langue du public cible, et transmet le texte résultant à l'antenne et sur YouTube.
Apparemment, le 12/11/2020, quelque chose s'est mal passé avec CNN dans ce système complexe, et la sortie du décrypteur a été mélangée avec des morceaux d'une transcription non déchiffrée. Même s'ils découvraient un échec lors du transfert, ils ont décidé de ne rien toucher pour que quelque chose de plus important ne se rompe pas. L'affaire sur Fox News en 2013 a fait beaucoup plus de bruit : cette fois-là, le décrypteur n'a pas fait face au nom de Dzhokhar Tsarnaev , qui a provoqué l' explosion au marathon de Boston, et lui a substitué le nom de l'actrice Zooey Deschanel dans les sous-titres .