Les éditeurs de Netology ont préparé une traduction adaptée de l'article de Wired sur cet inconnu d'un large cercle de l'histoire, sur les développements de Bledsoe et de son équipe qui sont utilisés dans la technologie moderne de reconnaissance faciale.
Pendant une trentaine d'années, Woody Bledsoe a été professeur à l'Université du Texas à Austin et a travaillé sur le développement du raisonnement automatisé et de l'intelligence artificielle. Selon les mémoires de Lance, le fils de Bledsoe, le professeur était un scientifique optimiste enthousiaste qui, à la fin des années 1950, rêvait de créer un ordinateur doté de capacités humaines et capable de prouver des théorèmes mathématiques complexes, de maintenir une conversation et de jouer au ping-pong décent.
Mais au début de sa carrière, Bledsoe recherchait vivement une opportunité d'apprendre aux machines à reconnaître les visages - une capacité humaine sous-estimée mais potentiellement puissante. Ce sont les premières études sur l'identification des visages (1960), et les travaux du professeur ont suscité l'intérêt des services de renseignement américains. Les principaux investisseurs de Woody étaient probablement des sociétés écrans de la CIA.
:
Aujourd'hui, la reconnaissance faciale est utilisée pour assurer la sécurité des téléphones, des ordinateurs portables, des passeports et des applications de paiement. Cette technologie devrait révolutionner le marché de la publicité ciblée et accélérer le diagnostic de certaines maladies. Dans le même temps, la technologie d'identification faciale se transforme en un instrument de pression gouvernementale et de surveillance des entreprises.
Par exemple, avec l'aide de cette technologie en Chine, le gouvernement suit les représentants de la minorité ethnique ouïghoure, dont des centaines de milliers ont été placés dans des camps de prisonniers politiques. Et aux États-Unis, selon le Washington Post, la police de l'immigration et des douanes et le FBI mènent une recherche numérique: à la recherche de suspects dans les bases de données gouvernementales des permis de conduire - parfois sans aller au tribunal.
En 2019, une enquête du Financial Times a révélé que des chercheurs de Microsoft et de l'Université de Stanford avaient collecté et rendu public un grand nombre de paquets de données d'images de personnes à l'insu ou sans le consentement de la personne photographiée. Par la suite, ces données ont été détruites, mais des chercheurs de startups technologiques et d'une académie militaire chinoise ont réussi à les obtenir.
Les recherches de Woody Bledsoe sur la reconnaissance faciale dans les années 1960 ont anticipé les percées technologiques et les aspects éthiques que nous constatons aujourd'hui. Pourtant, ces œuvres fondamentales sont presque entièrement inconnues - la plupart d'entre elles n'ont jamais été rendues publiques.
En 1995, pour des raisons inconnues, Woody a demandé à son fils de détruire les archives de recherche. Mais la plupart des articles ont survécu et des milliers de pages de son travail sont maintenant conservées au Briscoe Center for American History de l'Université du Texas.
Entre autres, des dizaines de photographies de personnes ont survécu, et certains visages sont marqués d'étranges notations mathématiques, comme s'ils étaient frappés par une sorte de maladie de peau «géométrique». Dans ces portraits, on peut discerner l'histoire de l'émergence de la technologie, qui dans les décennies à venir se développera activement et pénétrera dans de nombreux domaines de l'activité humaine.
Comment tout a commencé. Méthode Tuple
Woodrow Wilson (Woody) Bledsoe est né en 1921 dans une grande famille d'un métayer de l'Oklahoma. Il était le dixième enfant de la famille et pour autant qu'il se souvienne, il aidait toujours son père à faire le ménage. Il possédait un état d'esprit mathématique. Diplômé des études secondaires. Il a étudié pendant trois mois à l'Université de l'Oklahoma, après quoi Woody a été enrôlé dans l'armée à la veille de la Seconde Guerre mondiale.
Après la guerre, Woody a étudié les mathématiques à l'Université de l'Utah, puis est parti à Berkeley pour poursuivre son doctorat. Après avoir obtenu son diplôme d'études supérieures, Woody a travaillé dans la recherche sur les armes nucléaires à la Sandia Corporation appartenant au gouvernement au Nouveau-Mexique - avec des sommités telles que Stanislaw Ulam, qui a aidé à créer la bombe à hydrogène.
Chez Sandia, Woody a fait ses premiers pas dans le monde de l'informatique, un engagement qui se poursuivra tout au long de sa vie. J'ai d'abord écrit le code des projets d'armes nucléaires. Et plus tard, Woody s'est intéressé à la reconnaissance automatique de formes, en particulier à la lecture automatique - le processus consistant à apprendre au système à reconnaître des images non marquées de caractères écrits.
Woody Bledsoe et son collègue Iben Browning, polymathe, ingénieur aéronautique et biophysicien, ont proposé une méthode qui deviendra plus tard connue sous le nom de méthode n-tuple.
Les scientifiques ont commencé par projeter un symbole imprimé - disons la lettre Q - sur une grille rectangulaire de cellules, comme une feuille de papier lignée. Chaque cellule-cellule s'est vu attribuer un nombre binaire en fonction de la présence ou de l'absence d'une partie du symbole qu'elle contient: 0 - pour une cellule vide, 1 - pour une cellule pleine. Les cellules ont ensuite été regroupées au hasard en paires ordonnées, comme des ensembles de coordonnées. En théorie, les groupes peuvent inclure n'importe quel nombre de cellules, d'où le nom de la méthode. Ensuite, à l'aide de plusieurs étapes mathématiques, le système a attribué une valeur unique à la grille de symboles. Et quand un nouveau symbole a été rencontré, la grille de ce symbole a été comparée avec d'autres dans la base de données jusqu'à ce que la correspondance la plus proche soit trouvée.
L'essence de la méthode était qu'elle permettait de reconnaître de nombreuses variantes du même signe: la plupart des Q avaient tendance à obtenir des résultats assez similaires par rapport aux autres Q. Le processus fonctionnait mieux avec n'importe quel motif, pas seulement du texte. Selon Robert S. Boyer, mathématicien et ami de longue date de Woody, la méthode du tuple a aidé à définir la portée de la reconnaissance de formes. C'était l'une des premières étapes de la question: "Comment puis-je programmer une machine pour faire ce que font les gens?"
À l'époque où il développait la méthode des tuples, Woody avait d'abord rêvé de créer une machine, qu'il appelait «l'homme de l'ordinateur».
Des années plus tard, il a rappelé «l'excitation sauvage» qu'il a ressentie lors de la formulation des compétences pour l'intelligence artificielle:
«Je voulais qu'il lise des caractères dactylographiés et des textes manuscrits. Je pouvais le voir ou une partie de lui dans un petit appareil photo qui serait attaché à mes lunettes, avec un écouteur à travers lequel je l'entendais appeler les noms de mes amis et connaissances quand je les rencontrais dans la rue ... Vous voyez, mon ami informatique pourrait pour reconnaître les visages. "
Recherche chez Panoramic Research Incorporated
En 1960, Woody - avec Iben Browning et un autre collègue de Sandia - a fondé Panoramic Research Incorporated (Panoramic). Ils étaient initialement logés dans un petit bâtiment à Palo Alto, qui n'était pas encore connu comme le cœur de la Silicon Valley. À l'époque, la plupart des ordinateurs - des appareils massifs qui stockaient des données sur des cartes perforées ou des bandes magnétiques - étaient hébergés dans les bureaux de grandes entreprises et de laboratoires gouvernementaux. L'entreprise de Woody ne pouvait pas se permettre d'acheter un ordinateur, alors les scientifiques ont loué du temps de calcul sur une telle machine à leurs voisins, souvent tard dans la nuit quand c'était moins cher.
L'activité de Panoramic consistait à «tester des idées qui, nous l'espérions, bouleverseraient le monde».
Selon Nels Winkless, un écrivain et consultant qui a été impliqué dans plusieurs projets Panoramic et a cofondé plus tard le magazine Personal Computing, "leur travail consistait à faire ce que les autres trouvent trop stupide."
Les inventions de certains des chercheurs de Panoramic sont devenues largement connues. Par exemple, Helen Chan Wolf, une pionnière de la programmation de robots, a travaillé sur Shakey the Robot. Selon l'Institut des ingénieurs électriciens et électroniciens, il s'agit du «premier robot au monde à incarner l'intelligence artificielle».
Panoramic a tenté en vain de trouver des financements. Woody a fait de son mieux pour présenter la technologie de reconnaissance des personnages, notamment en présentant l'invention à la Fair Life Insurance Society et au magazine McCall's. Mais le contrat n'a jamais été signé.
Tout au long de son existence, Panoramic a eu au moins un mécène fiable pour le maintenir à flot, la Central Intelligence Agency.
S'il y avait des références à la CIA dans les journaux de Woody Bledsoe, il est fort probable qu'elles aient été détruites en 1995. Mais des fragments de matériaux survivants indiquent clairement que la société Woody a travaillé avec des sociétés écrans de la CIA pendant de nombreuses années. Nels Winkless, qui était ami avec l'équipe Panoramic, dit que l'entreprise a très probablement été créée grâce au financement d'une agence. «Personne ne m'en a jamais parlé directement», se souvient Winkless, «mais c'était le cas.»
Panoramic Research Incorporated était l'une des 80 organisations travaillant sur le projet MK-Ultra, selon le site d'enquête sur la loi sur le libre accès à l'information (FIA), le Black Vault. Il s'agit du tristement célèbre programme de «contrôle mental» de la CIA qui utilisait la torture psychologique sans le consentement des gens. Par l'intermédiaire de la fondation de recherche factice, la Medical Sciences Research Foundation, Panoramic a été chargé d'entreprendre des sous-projets pour étudier les toxines bactériennes et fongiques et pour «contrôler à distance certaines espèces animales».
David H. Price, anthropologue à l'Université Saint Martin, pensait que Woody et ses collègues recevaient également de l'argent de la Society for the Study of Human Ecology. Au nom de cette société, la CIA a accordé des subventions à des scientifiques dont les travaux pourraient améliorer les méthodes d'interrogation utilisées par l'agence, ou servir de couverture à de telles recherches.
Mais la recherche la plus importante de Panoramic a été fournie par une autre société fictive, le King-Hurley Research Group (King-Hurley). Selon une série de poursuites intentées dans les années 1970, la CIA a utilisé ce groupe de recherche pour acheter des avions et des hélicoptères pour l'agence secrète de l'armée de l'air connue sous le nom d'Air America. Pendant un certain temps, King-Hurley a également financé la recherche psychopharmacologique à Stanford.
Au début de 1963, King-Hurley n'acceptait que diverses présentations d'idées de Woody Bledsoe. Il a proposé de mener "des recherches pour déterminer la faisabilité de créer une machine simplifiée de reconnaissance faciale". S'appuyant sur son travail et celui de Browning sur la méthode du tuple, Woody voulait apprendre au système à reconnaître 10 visages. Autrement dit, il a prévu d'utiliser une base de données de 10 photographies de personnes différentes et de savoir si la machine peut identifier de nouvelles photographies de chacune d'elles. «Il sera bientôt possible d'augmenter le nombre de personnes à des milliers», a écrit Woody. En l'espace d'un mois, King-Hurley lui a donné la permission de commencer à travailler.
Premières expériences dans le domaine de la reconnaissance faciale
Identifier dix personnes peut sembler un objectif plutôt modeste aujourd'hui, mais en 1963, c'était incroyablement ambitieux. Le saut de la reconnaissance écrite des caractères à la reconnaissance faciale a été gigantesque. Ne serait-ce que parce qu'il n'y avait ni méthode standard de numérisation des photographies, ni base existante d'images numériques sur laquelle s'appuyer. Les chercheurs modernes peuvent entraîner leurs algorithmes sur des millions de selfies accessibles au public, et Panoramic devrait créer une base de données à partir de zéro.
Il y avait aussi un problème plus grave: les visages tridimensionnels des personnes, contrairement aux signes bidimensionnels, ne sont pas statiques. Les images d'une même personne peuvent différer par la rotation de la tête, l'intensité lumineuse et l'angle, ainsi que selon l'âge, la coiffure et l'humeur - sur une photo, une personne peut sembler insouciante, sur une autre - anxieuse.
Par analogie avec la recherche d'un dénominateur commun dans une fraction extrêmement complexe, l'équipe a dû ajuster la variabilité et ordonner les images qu'elle comparait.
Et il ne serait guère possible de dire avec certitude que leurs ordinateurs se chargeront de cette tâche. L'une des machines principales était le CDC 1604 avec 192 Ko de RAM - environ 21 000 fois moins qu'un smartphone moderne typique.
Dès le début, Woody était pleinement conscient de ces complexités, il a donc choisi une approche diviser pour conquérir: il a divisé la recherche en morceaux et les a confiés à différents collaborateurs.
Le travail de numérisation des images s'est déroulé comme suit. Le chercheur a pris des photographies en noir et blanc des participants au projet sur un film 16 mm. Puis il a utilisé le dispositif de numérisation que Browning avait développé pour transformer chaque image en dizaines de milliers de points de données. Chaque point devait avoir une valeur d'intensité lumineuse comprise entre 0 (le plus sombre) et 3 (le plus clair) - à un certain endroit de l'image. Il y avait trop de points à traiter par l'ordinateur à la fois, alors le chercheur a écrit le programme NUBLOB, qui a découpé l'image en échantillons aléatoires et calculé une valeur unique pour chacun, comme celles attribuées à l'aide de la méthode des tuple.
Woody, Helen Chan Wolfe et un autre chercheur ont travaillé sur l'inclinaison de la tête. Tout d'abord, les scientifiques ont dessiné une série de petites croix numérotées sur le côté gauche du visage du sujet, du haut du front au menton. Ensuite, ils ont fait deux portraits, dans l'un desquels la personne regardait vers l'avant, et dans l'autre - tourné à 45 degrés. Après analyse de la localisation des croix dans ces deux images, les données ont été extrapolées à une image de visage avec une rotation de 15 ou 30 degrés. Une image en noir et blanc d'un visage marqué a été chargée dans un ordinateur, et la sortie était un portrait à rotation automatique - effrayant, précis et étonnamment précis.
Les solutions des chercheurs étaient originales, mais pas assez efficaces. Treize mois après le début des travaux, l'équipe de Panoramic a admis qu'elle n'avait pas réussi à entraîner la machine à reconnaître au moins un visage, et encore moins dix.
La croissance des cheveux, les expressions faciales et les signes du vieillissement - ce triple défi représentait «une source colossale de variabilité», écrivait Woody dans son rapport d'étape de mars 1964 à King-Hurley. La tâche définie «va au-delà de l'état actuel du domaine de la reconnaissance de formes et des technologies informatiques modernes». Dans le même temps, Woody a recommandé de financer davantage de recherches pour essayer de trouver une «approche complètement nouvelle» pour résoudre le problème de la reconnaissance faciale.
Approche «homme-machine» de la reconnaissance faciale
Au cours de l'année suivante, Woody est arrivé à la conclusion que l'approche la plus prometteuse de la reconnaissance faciale automatisée est celle qui réduit la zone aux relations entre les principaux éléments: les yeux, les oreilles, le nez, les sourcils, les lèvres.
Le système qu'il proposa était similaire à celui du criminologue français Alphonse Bertillon, qu'il créa en 1879. Bertillon a décrit des personnes sur la base de 11 mesures physiques, y compris la longueur de la jambe gauche et la longueur du coude à l'extrémité de l'orteil moyen. L'idée était que si suffisamment de mesures étaient prises, chaque personne serait unique. La méthode prenait du temps, mais elle fonctionnait: avec l'aide de celle-ci en 1897, bien avant l'utilisation généralisée des empreintes digitales, les gendarmes français ont identifié le tueur en série Joseph Vache.
Tout au long de 1965, Panoramic a tenté de créer un système d'identification de visage Bertillon entièrement automatisé. L'équipe essayait de développer un programme qui pourrait définir le nez, les lèvres et plus encore en utilisant les zones claires et sombres d'une photographie. Mais ils ont échoué.
Ensuite, Woody et Wolfe ont adopté ce qu'ils ont appelé l'approche «homme-machine» de la reconnaissance faciale - une technique qui incorporait un peu de contribution humaine dans l'équation.
Woody a attiré son fils Gregory et son ami vers le projet - ils ont reçu 122 photographies, qui montraient environ 50 personnes. Les gars ont pris 22 mesures de chaque visage, y compris la longueur de l'oreille et la largeur de la bouche. Wolfe a ensuite écrit un programme pour traiter les données.
. , : , .
Leur prochaine étape, à la fin de 1965, fut de créer une version plus grande de la même expérience pour rendre «l'homme» plus efficace dans leur système homme-machine. Avec l'argent de King-Hurley, ils ont acheté la tablette RAND, un appareil de 18 000 $ qui ressemblait à un scanner d'images à plat mais fonctionnait comme un iPad. À l'aide d'un stylet, le chercheur a dessiné sur une tablette et a reçu en sortie une image informatique d'une résolution relativement élevée.
Un nouveau lot de photos a été pris à travers la tablette RAND, mettant en valeur les éléments clés du visage avec le stylet. Ce processus, bien que complexe, a été beaucoup plus rapide qu'auparavant: des données ont été saisies pour environ 2000 images, dont au moins deux images de chaque visage. Environ 40 images ont été traitées par heure.
Même avec cet échantillon plus large, l'équipe de Woody a eu du mal à surmonter les obstacles habituels.
Le problème du sourire, qui «déforme le visage et modifie radicalement les dimensions interfaciales», ainsi que le vieillissement, n'est pas encore résolu.
En essayant de faire correspondre la photo de Woody de 1945 avec la photo de 1965, le système s'est confondu. Elle a vu peu de ressemblance entre un jeune homme avec un large sourire et des cheveux foncés épais et un homme plus âgé avec une expression sombre et des cheveux clairsemés.
Photo de Woody Bledsoe d'après une étude de 1965. Photographe: Dan Winters
C'était comme si des décennies avaient créé une personne différente - et dans un sens, c'était le cas. À ce stade, Woody était fatigué de chercher de nouveaux contrats pour Panoramic et se retrouva «dans la position ridicule de trop de travail ou pas assez». Il a continuellement présenté de nouvelles idées à ses sponsors, dont certaines sont aujourd'hui considérées comme éthiquement discutables.
En mars 1965 - 50 ans avant que la Chine ne commence à utiliser l'appariement facial pour identifier les Ouïghours ethniques dans la province du Xinjiang - Woody a invité l'Agence de projets de recherche avancée (ARPA) du ministère américain de la Défense à soutenir Panoramic dans l'étude de l'utilisation des traits. personnes pour déterminer l’origine raciale d’une personne. «Il existe un très grand nombre de dimensions anthropologiques de personnes du monde entier qui appartiennent à différents groupes raciaux et écologiques», a écrit Woody. «C'est un entrepôt de données vaste et précieux qui a été collecté avec beaucoup de difficultés et de dépenses, mais qui n'a pas été utilisé correctement. On ignore si l'ARPA a accepté de financer ce projet.
Woody a investi des milliers de dollars dans Panoramic de ses propres fonds sans aucune garantie de leur retour. Pendant ce temps, ses amis de l'Université du Texas à Austin l'ont persuadé de trouver un emploi à l'université, l'attirant avec un salaire stable. Et en janvier 1966, Woody quitta Panoramic. La société a fermé peu de temps après.
Avec le rêve de créer un informaticien, Woody a déménagé avec sa famille à Austin pour se consacrer à l'étude et à l'enseignement du raisonnement automatisé. Mais son travail sur la technologie de reconnaissance faciale ne s'est pas arrêté là.
L'expérience de reconnaissance faciale la plus réussie de Woody Bledsoe
En 1967, Woody a accepté une mission finale liée à la reconnaissance des formes faciales. Le but de l'expérience était d'aider les forces de l'ordre à parcourir rapidement les bases de données des personnes arrêtées à la recherche de correspondances.
Comme auparavant, le financement du projet semble provenir du gouvernement américain. Un document de 1967, déclassifié par la CIA en 2005, mentionne un "contrat externe" pour un système de reconnaissance faciale qui réduirait le temps de recherche au centuple.
Le principal partenaire du projet de Woody était Peter Hart, ingénieur de recherche au Laboratoire de physique appliquée du Stanford Research Institute. (Maintenant connu sous le nom de SRI International. L'institut s'est séparé de l'Université de Stanford en 1970 en raison de différences sur le campus par rapport à la forte dépendance de l'institut au financement militaire.)
Woody et Hart ont commencé avec une base de données d'environ 800 images - deux de chacun des «400 hommes adultes de race blanche». Les personnes photographiées différaient par l'âge et le tour de tête. À l'aide d'une tablette RAND, les scientifiques ont enregistré 46 coordonnées pour chaque photographie, dont cinq valeurs pour chaque oreille, sept pour le nez et quatre pour chaque sourcil. S'appuyant sur l'expérience précédente de Woody avec la normalisation de la variation d'image, une équation mathématique a été utilisée pour «tourner» les têtes en vue frontale. Ensuite, pour tenir compte de la différence d'échelle, chaque image a été agrandie ou réduite à une taille standard, où la métrique de référence était la distance entre les élèves.
La tâche du système était de mémoriser une version de chaque personne et de l'utiliser pour identifier l'autre.
Woody et Hart ont offert à la voiture l'un des deux raccourcis. Dans le premier, connu sous le nom d'appariement de groupe, le système divisait le visage en caractéristiques - sourcil gauche, oreille droite, etc. - et comparait les distances relatives entre eux.
Photographe: Dan Winters La
seconde approche était basée sur la théorie de la décision bayésienne, où la machine utilisait 22 dimensions pour faire une estimation éclairée générale.
En conséquence, les deux programmes ont fait face à la tâche à peu près également. Et s'est également avéré meilleur que les rivaux humains. Lorsque Woody et Hart ont demandé à trois personnes de faire correspondre des sous-groupes de 100 individus, même le plus rapide d'entre eux a pris six heures. Le CDC 3800 a accompli une tâche similaire en environ trois minutes, permettant une réduction du temps de 100 fois. Les humains étaient mieux à même de gérer les tours de tête et la mauvaise qualité des photos, mais l'ordinateur était «largement supérieur» pour détecter les changements liés à l'âge.
Les chercheurs ont conclu que la machine «domine» ou «domine presque» la personne. Ce fut le plus grand succès de Woody dans ses recherches sur la reconnaissance faciale.
C'était aussi son dernier ouvrage sur le sujet, qui n'a jamais été publié «dans l'intérêt de l'État», ce que Woody et Hart ont grandement regretté.
En 1970, deux ans après la fin de sa collaboration avec Hart, un technicien robotique du nom de Michael Kassler a déclaré à Woody que Leon Harmon de Bell Labs prévoyait une étude sur la reconnaissance faciale. «Je suis scandalisé que ce deuxième type d'étude soit publié et finisse par être le meilleur système homme-machine», a répondu Woody. Woody a dû être déçu lorsque la recherche de Harmon a fait la une de Scientific American quelques années plus tard - alors que son propre travail plus avancé était conservé dans des réserves.
Utilisation de la méthode Woody Bledsoe dans la technologie moderne de reconnaissance faciale
Dans les décennies qui ont suivi, Woody a remporté des prix pour ses contributions au raisonnement automatisé. Pendant un an, il a été président de l'Association pour le développement de l'intelligence artificielle. Mais son travail sur la reconnaissance faciale est resté largement méconnu et presque oublié, tandis que d'autres collectionnaient des lauriers.
En 1973, l'informaticien japonais Takeo Kanade a fait un grand pas en avant dans la technologie de reconnaissance faciale.
À partir d'une base de données de 850 photographies numérisées de l'Exposition universelle de Sweet (Japon) en 1970, le Canada a développé un programme qui pouvait extraire les traits du visage - nez, bouche et yeux - sans intervention humaine. Le Canada a réussi à réaliser le rêve de Woody d'exclure l'homme du système homme-machine.
Woody a utilisé sa connaissance de la reconnaissance faciale à plusieurs reprises au fil des ans.
En 1982, il a été amené en tant qu'expert dans une affaire pénale en Californie. Un membre présumé de la mafia mexicaine a été accusé d'avoir commis une série de vols dans le comté de Contra Costa. Le procureur disposait de plusieurs éléments de preuve, notamment des images de vidéosurveillance d'un homme aux cheveux longs avec une barbe, des lunettes de soleil et un chapeau d'hiver. Mais sur les photographies, l'accusé semblait être un homme rasé de près et aux cheveux courts. Woody a mesuré le visage du voleur, l'a comparé à des photographies de l'accusé et a découvert que les visages appartenaient à deux personnes différentes en raison de la différence de largeur du nez. Malgré le fait que l'homme est toujours allé en prison, il a été acquitté de quatre chefs d'accusation, dont Woody a été témoin.
«Au cours des 10 dernières années seulement, la technologie de reconnaissance faciale a appris à traiter les imperfections», déclare Anil K. Jain, spécialiste en logiciels à la Michigan State University et co-éditeur du Handbook of Face Recognition.
Presque tous les problèmes auxquels Woody était confronté ont disparu. Aujourd'hui, il existe une offre inépuisable d'images numérisées. «Grâce aux médias sociaux, vous pouvez obtenir autant de photos de visage que vous le souhaitez», explique Jane. Et grâce aux progrès de l'apprentissage automatique, de la mémoire et de la puissance de traitement, les ordinateurs apprennent à apprendre efficacement. Avec quelques règles simples, ils peuvent analyser d'énormes quantités de données et créer des modèles pour presque tout, d'un visage humain à un sac de puces - plus aucune mesure avec une tablette RAND ou la méthode Bertillon n'est nécessaire.
Même en considérant le chemin parcouru par la reconnaissance faciale depuis le milieu des années 1960, Woody Bledsoe a identifié bon nombre des défis qui restent à relever dans ce domaine.
, - . , , , .
Bien que le programmeur ne demande pas explicitement aux systèmes modernes d’apprentissage en profondeur d’identifier les nez et les sourcils, le virage de Woody dans cette direction en 1965 a orienté l’industrie pendant des décennies. «Au cours des 40 premières années, c'est l'extraction de caractéristiques qui a dominé», déclare Takeo Kanade, maintenant professeur au Carnegie Mellon Institute of Robotics.
Aujourd'hui, dans une certaine mesure, ils sont revenus à ce qui ressemble aux premières tentatives de Woody pour «figurer» un visage humain, quand il a utilisé une variante de la méthode du tuple pour trouver des modèles de caractéristiques similaires dans un champ géant de points de données. Aussi complexes que soient les systèmes modernes de reconnaissance faciale, Anil Jane dit qu'ils comparent simplement des paires d'images et leur attribuent un score de similitude.
Mais peut-être plus important encore, le travail de Woody Bledsoe a donné le ton éthique à la recherche sur la reconnaissance faciale - à la fois pertinente et problématique. Contrairement à d'autres technologies qui changent le monde dont les capacités catastrophiques sont devenues apparentes au fil des ans - médias sociaux, YouTube, drones -, l'abus potentiel de la technologie de reconnaissance faciale est évident depuis sa création chez Panoramic.
De nombreux préjugés qui peuvent être attribués aux vestiges de l'époque de la recherche de Woody - l'attrait presque uniquement des Blancs pour les expériences, la confiance apparemment insouciante dans le gouvernement, le désir d'utiliser la reconnaissance faciale pour discriminer sur des bases raciales - tout cela est inhérent au domaine moderne de la reconnaissance faciale.
En 2019, lors des tests du logiciel Rekognition d'Amazon, 28 joueurs de la NFL ont été identifiés à tort comme des criminels. Quelques jours plus tard, l'American Civil Liberties Union a déposé une plainte auprès du ministère américain de la Justice, du FBI et de la Drug Enforcement Administration pour des informations sur leur utilisation de la technologie de reconnaissance faciale d'Amazon, Microsoft et d'autres sociétés. Un rapport de 2019 de l'Institut national des normes et de la technologie, qui a testé le code de plus de 50 développeurs de logiciels de reconnaissance faciale, a révélé que les hommes blancs étaient moins susceptibles d'être mis en correspondance avec des criminels que d'autres groupes. En 2018, quelques scientifiques ont émis de vives critiques: "Nous pensons que la technologie de reconnaissance faciale est le mécanisme de surveillance le plus dangereux jamais inventé."
Au printemps 1993, en raison d'une maladie dégénérative de la SLA, le discours de Woody s'est détérioré. Mais il a continué à enseigner à l'Université du Texas jusqu'à ce que son discours devienne illisible. Il a poursuivi ses recherches dans le domaine du raisonnement automatisé - jusqu'à ce qu'il cesse de tenir le stylo. Tout en restant scientifique jusqu'à la fin, Woody a pris des notes de son discours pour suivre l'évolution de la maladie.
Woody Bledsoe est décédé le 4 octobre 1995. La nécrologie ne mentionnait pas son travail en reconnaissance faciale. Sur la photo nécrologique, Woody aux cheveux gris regarde droit dans la caméra, un large sourire sur le visage.
Commentaire d'Elena Gerasimova, responsable de l' analyse et de la science des données chez Netology
Les idées de Woody Bledsoe n'ont pas eu de succès commercial, peut-être parce que leur temps est tombé sur l'un des «hivers de l'intelligence artificielle». Il y avait peu de confiance dans les technologies, il n'y avait pas assez de capacité pour démontrer des résultats impressionnants et les technologies de reconstruction du cerveau humain étaient principalement utilisées par des passionnés - l'académicien Andrei Nikolaevich Kolmogorov, le mathématicien américain George Tsibenko et d'autres.
Néanmoins, grâce à cette recherche, des percées modernes sont devenues possibles, basées sur une puissance de calcul puissante, des nuages, des puces.
En 1998, Yang LeCun a perfectionné des approches pour reconnaître les nombres manuscrits sur son LeNet - grâce à l'évolution de la puissance de calcul qui n'était pas disponible lors des recherches de Woody Bledsoe.
La technologie de reconnaissance faciale est à la limite d'une technologie de génération de visage plus avancée, qui est utilisée, par exemple, pour créer des deepfakes et générer des visages d'adultes et d'enfants, ainsi que de chats et de chiens. Il semblerait qu'il soit plus facile - de prendre une photo d'une personne et de la télécharger, sous condition, dans un catalogue électronique de vêtements; ou tourner une vidéo mignonne avec un bébé et des jouets; ou enseigner à un réseau de neurones à créer une image d'un enfant en vêtements, en intérieur ou avec un jouet, que l'on envisage de placer dans le catalogue et ainsi de démontrer? La réponse sera motivée par le montant des investissements dans les entreprises développant des technologies pour créer des images photoréalistes - rien qu'aux États-Unis en 2019, l'investissement total s'est élevé à plus de 500 millions de dollars.
Génération d'images photoréalistes de personnes
Si vous êtes intéressé à travailler avec des données, des réseaux de neurones, nous vous proposons de vous familiariser avec nos programmes, des formations dans lesquelles s'appuie sur une base scientifique et la recherche:
- Profession " Data Scientist ". Prix « Label de qualité » dans la nomination «Formation des professionnels de l'industrie numérique» (2019).
- Cours de Deep Learning . Sur la page d'accueil du cours, vous pouvez voir des exemples de projets dans le cours et voir comment se déroule la formation.
Et pour ceux qui recherchent des approches de mise en œuvre de l'intelligence artificielle, de l'apprentissage automatique et du «redémarrage numérique», nous vous suggérons de consulter les informations du cours « Transformation d'entreprise: l'introduction de l'intelligence artificielle ». Les étudiants créent une stratégie pour la mise en œuvre de l'intelligence artificielle et élaborent de véritables cas commerciaux sous la direction d'experts étrangers et russes.