Comment moi, un spécialiste de l'IA, j'ai acheté du texte sur l'IA

Aujourd'hui, je vais chez Habr, et, sous une tasse de thé, feuillette l'article " GPT-3 d'OpenAI peut devenir la meilleure chose depuis l'époque du Bitcoin ."



Si vous ne l'avez pas lu, lisez-le. La fin évoque des émotions vraiment fortes. Pour moi, ils ont été aggravés par le fait que je suis relativement professionnellement engagé dans l'IA, la génération de texte et le problÚme des significations - donc j'ai raisonnablement cru que je pouvais facilement reconnaßtre le texte généré par une machine ...



Oui, oui, je l'ai achetĂ©. Le texte de l'article "GPT-3 d'OpenAI pourrait ĂȘtre la plus grande chose puisque Bitcoin" a (peut-ĂȘtre) Ă©tĂ© crĂ©Ă© par l'IA, mais je ne l'ai pas vu, malgrĂ© le fait que, en gĂ©nĂ©ral, je le fais professionnellement et connais les techniques de base utilisĂ©es dans la machine gĂ©nĂ©rer du texte.



AprÚs le sommeil de mon premier choc léger, je voudrais partager un certain nombre de considérations.



Il ne s’agit pas de texte machine, mais de texte traitĂ© par l’homme



Peut-ĂȘtre que la premiĂšre rĂ©action au texte a Ă©tĂ© le dĂ©ni, le refus d'accepter que ce texte ait Ă©tĂ© fait par une machine. Mon cerveau a commencĂ© Ă  un rythme effrĂ©nĂ© pour trouver un argument appropriĂ© pour cela. De maniĂšre gĂ©nĂ©rale, je les considĂšre moi-mĂȘme plutĂŽt faibles, mais je veux tout de mĂȘme les citer:



  • On ne sait pas combien de pour cent du texte et comment l'auteur l'a Ă©ditĂ© . Il existe des exemples de texte qui semble avoir Ă©tĂ© crĂ©Ă© par une machine, mais corrigĂ© par une personne - par exemple, il y avait une fois une histoire sur un script de film / livre rĂ©alisĂ© par l'IA. La subtilitĂ© Ă©tait toujours dans les dĂ©tails - si vous lisez la critique, il a toujours Ă©tĂ© dit quelque chose dans l'esprit que l'IA a fait le dĂ©but de l'histoire, puis un groupe d'Ă©crivains l'a finalisĂ©e . J'ai toujours attribuĂ© la qualitĂ© du rĂ©sultat au fait que les Ă©crivains ont simplement apportĂ© leur propre sens Ă  la finalisation, car dans les peintures abstraites, avec un fort dĂ©sir, on peut trouver quelque chose . Peut-ĂȘtre que cet argument ne fonctionne pas ici, puisque, selon les assurances de l'auteur, il a seulement corrigĂ© la mise en forme du texte.
  • . , , . , « ?» . , , .
  • . , , . GPT-2, , - . - , , , . , «» GPT-3 , 



Cependant, je suis Ă©galement prĂȘt Ă  admettre que ces arguments sont plutĂŽt faibles et que la machine peut en effet maintenant crĂ©er des textes d'information relativement longs similaires Ă  des textes humains.



J'ai mis ma tasse de thé de cÎté et j'ai pensé: «Qu'est-ce que cela signifie? Quelle leçon puis-je tirer de cette histoire? Puis-je maintenant donner au moins quelques conseils sur la capacité de distinguer les bons textes des mauvais ou sans signification? "



Institut de réputation et vérification des faits



Revenant aux Ă©motions qui ont surgi au cours du processus de lecture, je me suis souvenu que le fragment de l'article, aprĂšs quoi j'ai commencĂ© Ă  «croire» Ă  ce qui se passait, Ă©tait une description de l'expĂ©rience sur le forum bitcointalk. Le dĂ©but de l'article ne m'a pas dĂ©rangĂ© - il est consacrĂ© aux faits sur la crĂ©ation de GPT-3, et je suis dĂ©jĂ  habituĂ© au fait que de tels faits ne disent rien sur l'auteur ou sa comprĂ©hension du sujet, puisqu'ils peuvent ĂȘtre empruntĂ©s de n'importe oĂč.



Mais la description de l'expérience était intéressante. En fait, il a créé le "contenu" de l'article - les rÚgles de publication, la réaction des autres personnes du forum ...



... et par conséquent, nous comprenons qu'il n'y a pas eu d'expérience.



Cela m'a conduit à des réflexions intéressantes. J'ai écrit il y a longtemps sur la modélisation des cycles économiques basés sur la croissance de la confiance... L'essentiel est que la croissance ne se produit que tant que les obligations des parties sont remplies - ou, plus simplement, si je vous dis "Je vous expédierai ce produit dans une semaine au prix de X", vous me faites confiance et je le ferai vraiment. Tout est basé uniquement sur la confiance - si vous ne me faites pas confiance, ou si je vais vous tromper, nous pouvons bien sûr essayer de résoudre l'affaire par le tribunal, mais cela s'accompagnera de frais HELLO. Imaginez ce que ce serait si chaque achat de yaourt dans un magasin était accompagné d'une sérieuse possibilité de litige ...



Et nous arrivons ici, Ă  mon avis, Ă  un grave problĂšme du monde moderne. En un sens, il ne nous reste presque plus d’institutions de rĂ©putation en ce qui concerne les mots et les textes, ce qui signifie que nous ne savons pas vraiment Ă  qui nous pouvons faire confiance .



Imaginez qu'un représentant d'un opérateur cellulaire vous appelle. Ou une banque. Avec une nouvelle offre unique et avantageuse pour vous. Croirez-vous que cela vous est bénéfique?



Les mĂ©dias peuvent accidentellement mettre la «mauvaise» photo. Ils peuvent considĂ©rer la situation d'un seul cĂŽtĂ©. Postez un article provocateur sur la page principale avec une petite inscription en bas «Ceci est la chronique de l'auteur. L'opinion de l'auteur peut ne pas coĂŻncider avec l'avis du comitĂ© de rĂ©daction. " Ils peuvent se rĂ©fĂ©rer Ă  un professeur inconnu de l'Institut mondial de Kukuevo avec les mots "Les scientifiques ont appris ..." Et ils n'obtiendront rien pour cela. Dans le pire des cas, ils se plaindront du manque de vĂ©rification des faits et publieront peut-ĂȘtre une rĂ©futation dans un coin oĂč vous ne la trouverez jamais aprĂšs quelques mois.



MĂȘme la prĂ©sence de personnes «compĂ©tentes» n'aide pas. Peut-ĂȘtre, je me souviens le mieux de toute l'histoire de la sociĂ©tĂ© Theranos ( sur HabrĂ© ), qui promettait une rĂ©volution presque mĂ©dicale et rĂ©unissait un conseil d'administration impressionnant (le conseil d'administration de la sociĂ©tĂ© comprenait des personnalitĂ©s aussi cĂ©lĂšbres que les anciens secrĂ©taires d'État amĂ©ricains Henry Kissinger et George Schultz). Il semblait Ă  tout le monde que de telles personnes ne pouvaient pas se tromper - mais en fait, elles se fondaient Ă©galement sur des assurances verbales, alors que la technologie, en fait, ne fonctionnait pas. Ne pensez pas que vous pouvez faire confiance Ă  quelque chose mĂȘme si vous y avez investi 700 millions de dollars.



Malheureusement, le fait est que maintenant nous ne pouvons plus faire confiance à l'opinion de quelqu'un d'autre. La réputation coûte trÚs peu et est volontiers échangée contre de l'argent. En fait, notre famille et nos proches restent le seul bon espace de confiance - et heureusement, les idées de marketing de réseau (Oriflame, etc.), exploitant la confiance personnelle, ont plus ou moins disparu de nos vies.



Mais revenons Ă  l'article ... J'ai tirĂ© deux conclusions pour moi-mĂȘme:



  • . – , / . . , , . , – . . ( , . GPT-2, , , )
  • , . , - « , ; ,  ». , , – , , .


Fluidité du texte et du dialogue



Je rassemble ma collection de textes gĂ©nĂ©rĂ©s et leurs gĂ©nĂ©rateurs. Mais je ne suis pas trĂšs intĂ©ressĂ© Ă  discuter de la façon dont les textes gĂ©nĂ©rĂ©s et les faux affecteront la sociĂ©tĂ© - bien que ce sujet puisse ĂȘtre bien payĂ©. Pour moi, chaque exemple de texte gĂ©nĂ©rĂ© est une question: "Quelle partie de la pensĂ©e humaine avons-nous pu formaliser?" Et "qu'est-ce qui est restĂ© inconnu et est encore l'apanage d'une personne?"



GPT-3 et les réseaux de neurones modernes, puisqu'ils s'entraßnent sur des textes, et non sur les significations incluses dans ces textes, sont de lointains descendants de la génération de textes dus aux réseaux N-grammes ou Markov, qui sont vraisemblablement utilisés dans Yandex.Abstracts . Si vous regardez les principes sous-jacents et des exemples de textes générés, vous pouvez introduire plusieurs rÚgles importantes:



  • . , . (.) 4-7 , GPT-3, , , . , – , , .
  • . , , , . - , «, » « Apple, , ». , . !
  • . « , , » « , » .


En outre, je voudrais dire sĂ©parĂ©ment sur le dialogue avec l'IA. En particulier, tout enseignant sait que rien ne peut ĂȘtre dit sur ses connaissances Ă  partir du rĂ©sumĂ© fourni par l'Ă©lĂšve. Mais si vous lui parlez pendant 5 Ă  10 minutes, il est facile de comprendre s'il «tĂątonne» ou non.



Dans mon article sur les chatbots, je mentionne que le principal problÚme de l'IA est désormais de prendre en compte le contexte du dialogue et de comprendre l'interlocuteur.... Il est facile d'imaginer une IA qui répond bien à une phrase spécifique - mais cela ressemble à une personne qui a un peu entendu parler de tout, mais qui n'en comprend pas l'essence. Parmi les étudiants, il y en a aussi - réagir aux phrases clés. Si vous ne touchez pas à des sujets complexes, n'évaluez pas les connaissances et la compréhension personnelles, vous pouvez avoir le sentiment que l'interlocuteur est un intellectuel et sait de quoi il parle, bien qu'en fait il ne répÚte que les vérités qu'il a entendues quelque part .



L'homme n'est évidemment pas déterminé par ce qu'il dit. Une personne est déterminée par le fait qu'elle peut agir en fonction de ses croyances. Il peut analyser son expérience ou percevoir l'expérience d'une autre personne.



Il n'est PAS exclusivement engagé dans des conversations, sans assumer aucune responsabilité pour ses propos.



All Articles