Auteurs de l'article: Ph.D. S. B. Pshenichnikov, Ph.D. COMME. Valkov
L'algèbre et le langage (écriture) sont deux outils de connaissance différents. Si nous les combinons, nous pouvons alors compter sur l'émergence de nouvelles méthodes de compréhension des machines. Déterminer le sens (comprendre), c'est calculer la relation entre la partie et le tout. Les algorithmes de recherche modernes ont déjà pour tâche de reconnaître le sens, et les processeurs tensoriels de Google effectuent des multiplications matricielles (convolutions) nécessaires à l'approche algébrique. Dans le même temps, les méthodes statistiques sont principalement utilisées dans l'analyse sémantique. En algèbre, il semblerait étrange d'utiliser des statistiques lors de la recherche, par exemple, de signes de divisibilité des nombres. L'utilisation de l'appareil algébrique est également utile pour interpréter les résultats de calculs lors de la reconnaissance du sens d'un texte.
Un texte est compris comme une séquence de caractères de nature arbitraire. Par exemple, les langages naturels, la notation musicale, les séquences génétiques de biopolymères, les codes (tables de codes en tant que relations de signes). Dans les textes musicaux écrits sur une portée à partir d'une ligne (portée «à cordes»), les signes sont des notes, des touches, des signes d'allitération, des indications de volume et de tempo. Dans les textes génétiques, les mots-signes sont des triplés. Jusqu'à présent, les systèmes de signes du goût et de l'odorat n'existent qu'en tant que systèmes naturels (comme des spécimens, comme un zoo). Pour le toucher, il existe un code Braille tactile à points bosselés. Le centre des systèmes de signes est la sémiotique [1] , qui se compose de trois balises: sémantique, syntaxique et pragmatique.
Un exemple de texte de langue:
Un ensemble est un objet qui est un ensemble d'objets. Un polynôme est un ensemble d'objets monômes qui sont un ensemble d'objets multiplicateurs. (une)
Pour transformer du texte en objet mathématique, vous devez le coordonner correctement. Le texte de l'exemple peut être lemmatisé (si les formes morphologiques sont importantes pour la tâche, la lemmatisation est optionnelle) - ramené à la forme normale: pour les noms, c'est le cas nominatif, singulier; pour les adjectifs - nominatif, singulier, masculin; pour les verbes, les participes, les gérondifs - un verbe à l'infinitif imperfectif:
()1,1 ()2,2 ()3,3 ()4,4 ()5,1 ()6,3 ("")7,7 ()8,8 ()9,2 ()10,1 ()11,3 ()12,12 ()13,4 ()14,1 ()15,3 ()16,16 ("")17,7 (2)
(2) . () , . – . . , . , (2). «» – ()1,1. ( ) . . . (2) - - 5,1: ()5,1. , – . , , . , . (2) ( ) 1 3. (...)5,5, (...)6,6 . ()5,1 ()6,3.
. ( – – ), . – - ( , ). , – . - «» . . – .
– . – , . , (), . (2) . (2):
()1,1 ()2,2 ()3,3 ()4,4 ("")7,7 ()8,8 ()12,12 ()16,16 (3)
(1) → (2) , , (...)i,j. , . - ·– («» «»), A N. . 24 . ( ) ( ):
, . . () ( ), . - , .
, . . Ei,j ( ) – , i j , . , n=2:
E1,2, E2,1 E1,1, E2,2 ( ). ( ), . , E1,1E2,1=0, E2,1E1,2=E2,2. . , . [2] .
(2) P ( ):
() (2) (5) , P - ( ). () (2) . (2) (5) «» ( -) «-».
(5) ( ) . . .
, (3) :
DR – P . P DR imax×imax, imax – () . P DR , . . DR . .
:
(5) , (2). , (, ), .
, F1, F2, …,Fk , . Fi () Fj (), Fij () , Fi=FijFj. . .
( ). (4) . n2 2(n-1) , (n2 – 2n – 2) – ( ).
– ( ), DR ( ).
– DR ( ), ( ).
, , , (). , , , .
. . .
. F1, F2, …,Fk () Fm , F1, F2, …,Fk Fm .
, . , . . . , . Fm. , Fm, Fm. , , . . . , , . , .
() , , , , .
– P , .
— . : (, , , ); (, , , , – ); ; , ; - (, , , , ).
– () . – -. - - , . ( ), .
(5) :
E – . , (5) (7). (DR+E5,1+E6,3) - . – (DR+E5,1+E6,3) () , ( ).
() (7) :
( ) E5,1 E6,3. E1,1 («») E3,3 («»), . , . . , . , ( ) .
. – (). – (). , – «». : , , . , - «» . – , , «».
DR (6) -. - n- ( -, ). , .
.
() .
– , , , DR. .
- . (, ).
– , . , (8) – ( ) « » « ».
, , , , - , , , ( ). – E8,8+E12,12+E16,16 (7) – ()8,8... ()12,12...()16,16 – F2 F1. () « » « ».
, . , , , ( ), , , .
. – – . – .
Pour la restructuration, une structuration algébrique du corpus des textes du langage est nécessaire pour compiler les dictionnaires ci-dessus du corpus du langage. Dans ce cas, les idéaux et les classes de résidus de l'anneau matriciel P txt du corpus de textes matriciels doivent être préalablement construits et étudiés.
Une description plus rigoureuse et générale de l'algèbre d'un texte est donnée dans [3] .