Introduction ou de quelle IA je parle
Je m'intéresse principalement à l'IA universelle en tant que machine permettant d'atteindre des objectifs complexes. C'est-à-dire une sorte de complexe matériel et logiciel, qui peut être dit: fabriquer un avion qui coûtera 100 dollars, parcourir 1000 kilomètres à une vitesse de 800 km / h et transporter 5 personnes. Ou comme ceci: guérir telle ou telle personne d'un cancer au stade terminal.
L'IA devrait être capable de faire face à de telles tâches, si cela est physiquement possible. Et si c'est impossible, obtenez le résultat le plus proche possible de celui donné.
Pour le moment, je vois deux façons d'obtenir une IA universelle.
La première façon est des systèmes comme l'apprentissage par renforcement. Ils se connectent aux capteurs et actionneurs de certains robots, et ils ont également un signal de récompense. L'apprentissage par renforcement (ci-après RL) fonctionne pour recevoir en moyenne autant de récompenses que possible. Et le canal de récompense est le principal moyen de dire à l'IA ce que nous attendons d'elle.
- , GPT-3, . . - , . , … GPT-3 “ - ” - . “ - ” - , . “ ?” GPT-3 , . GPT-3 .
Reinforcement Learning
.
- , RL , , , .
- . , .
,
, RL . - , 224224, , - . , , , , , . , - , , , - , , , . .
. :
1) , . , . ~1000-2000 . , , .
2) . - , “ ”, . , . , “ ”, , .
RL , .
RL . . RL - . - .
, RL . . RL , , .
?
-, RL . , , . - . .
- . RL , . , Doom, , , . RL , . RL - - , , . - - , , - , "" "".
, RL : Doom. .
RL , . , , - Exit.
RL , - , , , , , , Exit. , .
, , .
?
RL . . , .
, RL . , - - .
: RL , . , - , - . , RL - .
: , . , - . , RL , Exit. , “” - - , 5%, . , - , .
. , RL , . , , … : RL , , . , , , , , .
, RL , . . .
, , . - . : . -, . -, , , .
-. - Model-Based . “ ” - , , . ( , ) . , , -.
- , , ->, (, )-> .
.
. , . . RL , . , , , - . , RL , : , , .
, , , , , .
, , . , - RL.
? RL , , . , , . , - .
, . , , - , , . , - , - .
- - . , , .
- , . . , RL .
: ? , ?
: - , , … , .
: , , . , , , . , , , , 110 - , .
?
, : , , ( ). , “” “”.
, , . , , . “ , ”, - .
“ ” - , , . . , . , , . , , , . , -, “” , .
? ?
- . , -, , . , , RL . - , , - .
, . , . , RL “” - , , . ?
, . , - .
, , GAN. ( , - RL) , , . , . “” “” - , , - . .
, RL , - . , .
-
, , . , , , , - , .
, - RL - , . RL, . - - , RL.
RL . ( --) - : , , … , .
, . , , , .
, . , . . - “ ”, .
, , , , , . , , , - .
, RL . , . , RL - , , . , . .
, , , . , , -, . , . : 1000$ 100$ . ? , , . , . , . , - , - - . , , , . , , RL, , , , RL .
- , ( ) - , . , - , . RL - , . , - RL . , .
, , , . , .
, , .
J'ai conçu cet article comme un moyen de provoquer le dialogue. Je me trompe sûrement quelque part et il y a des solutions plus astucieuses que celles auxquelles j'ai réussi à penser. Les commentaires détaillés et les débats intéressants sont les bienvenus!