La nature n'est pas un référentiel, mais un atelier. Encore une fois sur les similitudes et les différences entre l'ADN et le code du programme

Les avancées technologiques du début du XXIe siècle, en particulier le décodage du génome humain et une compréhension générale des principes de l'édition du génome, induisent tout naturellement la comparaison de la biologie synthétique avec la programmation. En effet, l'ontogénie et la biochimie sont à bien des égards comparables aux processus programmés, puisqu'elles obéissent à une logique interne, sont réalisées étape par étape, dépendent du contexte et répondent aux interférences externes ( édité ). Il est tentant de comparer le code ADN à quatre lettres avec le code binaire de la machine.



Néanmoins, dans cet article, nous supposerons que de telles analogies sont plus audacieuses que précises, et essayerons de comprendre pourquoi l'ADN peut être considéré comme un substrat pour une programmation génétique à part entière, mais en lui-même assez éloigné du langage de programmation et du langage lui-même.



L'ADN est le modèle de la synthèse des protéines et est finalement conçu pour transporter le matériel génétique de génération en génération. Ainsi, le code génétique peut être considéré comme réalisable s'il permet au porteur de laisser de nombreux descendants fertiles, qui en même temps se révèlent être ni moins ni plus viables que les représentants de la génération parentale. Cette tâche est formulée de manière assez large, donc l'évolution, avec tout son succès, est une entreprise « riche » et accable sa progéniture d'une énorme base de code hérité, commenté et impitoyablement déplacé.



La biologie synthétique, à son tour, se fixe des objectifs beaucoup plus clairement définis que l'évolution. Par exemple, le domaine d'application le plus sérieux de la technologie CRISPR est associé àdéveloppements antitumoraux , alors que les cellules cancéreuses elles-mêmes sont le fruit d' une sélection naturelle aveugle - la sélection les soutient, car elles parviennent à quitter efficacement et rapidement la progéniture, ainsi qu'à imiter les cellules saines du tissu affecté.



Le code ADN ressemble plus à un langage naturel qu'à un langage de programmation, car il est redondant, accumule rapidement des erreurs, plein de dépendances complexes qui sont déterminées par le contexte du développement d'un organisme, et le préjudice ou l'utilité de ces dépendances n'est pas toujours évident.



Un exemple est largement connu avec la drépanocytose, une maladie héréditaire, à la suite de laquelle le globule rouge humain devient irrégulier et ressemble plus à un croissant de lune qu'à un beignet.







On suppose qu'un érythrocyte de forme irrégulière rend difficile le paludisme et n'est pas pratique pour les plasmodes du paludisme, ce qui donne au porteur de cette maladie une chance supplémentaire de vivre jusqu'à l'âge de la procréation et de mourir seulement d'une crise cardiaque. En fonction des conditions de vie et de l'âge de l'individu, nous sommes confrontés à «à la fois un bug et une fonctionnalité dans un codon».



Lors du «test» de ces modifications génétiques in vivo, la sélection naturelle n’était pas limitée par le calendrier et les exigences de qualité, mais plutôt développée dans des conditions, dont beaucoup peuvent être comparées à la DDD... Poursuivant l'analogie avec le système circulatoire, nous pouvons appeler le sang bleu des céphalopodes une solution orientée sujet. En tant que métal similaire au fer, le sang de poulpe contient du cuivre. Selon les dernières recherches, cette découverte évolutive optimise l'oxygénation du sang dans l'eau froide et à de faibles concentrations d'oxygène en tant que telles .



Si l'on imagine tester de réels développements biotechnologiques in vivo comme un code logiciel est testé, ici l'extrapolation se heurte à des incohérences et des difficultés évidentes, qui sont notamment évoquées dans l' article de Bruce Schneier et Larisa Rudenko:

Imaginez un biotechnologiste essayant d'augmenter l'expression d'un gène qui permet aux cellules sanguines de se reproduire normalement . Bien que l'opération soit assez simple selon les normes actuelles, elle ne réussira presque certainement pas du premier coup. Dans le cas du code logiciel, tous les dommages qui seraient causés par un tel code sont le crash du programme dans lequel il s'exécute. En biologie, un code aussi erroné pourrait augmenter considérablement la probabilité d'une variété de leucémies et détruire les cellules vitales du système immunitaire.
En outre, les auteurs font l'observation importante suivante:

, «» , , , . «» , . , .
De même, il est très difficile d'imaginer un code génétique «multiplateforme» qui fonctionnerait, par exemple, sur Terre et sur Mars. L'ADN, dont une partie importante est non codante, a évidemment une redondance d'informations significative, mais en même temps, en règle générale, il ne convient pas à un réajustement biochimique pour travailler sur d'autres planètes ou même dans des conditions confortables pour les extrémophiles sur Terre. Les extrémophiles, à leur tour, ont pu survivre sur Terre dans des conditions proches de celles de Mars.



Ainsi, une adaptation significative du code génétique à des conditions fondamentalement défavorables n'a lieu qu'à la périphérie de la biochimie, et les écosystèmes terrestres typiques sont également destructeurs pour la plupart des extrémophiles .



Il est intéressant de noter que même Stanislav Lem dans son "Sum of Technology" a abordé l' aspect le plus important de l'information biologique - sa conditionnalité la plus sérieuse par le contexte du développement de l'organisme:

( ), , . , «»… , ? , . ; ? , ; , ; , , . , , ; : .
Enfin, on sait que les quatre nucléotides qui composent la molécule d'ADN ne sont pas les seuls possibles. Des nucléotides synthétiques ont déjà été créés qui augmentent la capacité du code génétique, ainsi qu'une bactérie synthétique capable de produire un acide aminé absent dans d'autres organismes vivants.



Ainsi, l'ADN peut être en partie comparable au code machine , qui a déjà été écrit sur Habré, mais il diffère du code source, tout d'abord par sa redondance, son imprévisibilité et son orientation objet. Par conséquent, le phénomène de la technologie Cello , qui permet de traduire le code source en séquences nucléotidiques d'ADN, semble tout à fait logique . Les personnes intéressées peuvent se familiariseravec le référentiel Cello Github (en utilisant le langage Verilog ).



Ainsi, les analogies entre l'ADN et le code machine sont plutôt arbitraires, tandis que les analogies avec le code source ne semblent pas convaincantes jusqu'à présent. L'ADN ressemble beaucoup plus à un langage naturel pour la communication d'un organisme vivant avec l'environnement. Mais l'ordre et l'extensibilité importants de l'alphabet ADN sont tout à fait propices à la création d'un langage de programmation à part entière basé sur celui-ci, et, éventuellement, à la création de compilateurs. Peut-être qu'un tel langage sera comparable à l'ADN car Java ou Python sont comparables à l'anglais, ou il emprunte la syntaxe à l'ADN, mais change partiellement ou complètement la sémantique des codons. De plus, étant donné ce qui précède, un langage de programmation biologique complet devrait avoir une fonction d'auto-guérison et, éventuellement, beaucoup plus de potentiel pour réduire l'entropie que ce qui est inhérent àvie biologique. Le code génétique implémenté dans la biosphère terrestre est extrêmement intéressant en tant que porteur d'informations et, très probablement, avec un certain raffinement et une augmentation de l'abstraction, il pourra concurrencer exactement un langage de programmation de bas niveau.



Il reste à vivre à la hauteur de cela.



All Articles