Des chercheurs américains ont réussi à stocker tout un livre dans une séquence d'ADN pesant moins d'un milliardième de gramme. Il n'est cependant pas encore question de transformer le corps humain en support d'enregistrement de données…

C'est peut-être la technologie d'avenir pour le stockage d'immenses quantités de données. Une équipe de recherche dirigée par George Church, un biologiste de synthèse de l'école médicale de Harvard, a publié cette semaine dans la revue Science un article dans lequel elle affirme avoir stocké un livre entier dans un picogramme d'ADN (un milliardième de gramme). 

Dans une cellule, l'ADN est composé de quatre types de molécules, dites nucléotides, qui s'accrochent ensemble pour former un brin. Ces quatre nucléotides forment une espèce d'alphabet de l'ADN, symbolisé par les lettres A (adénine), C (cytosine), T (thymine), et G (guanine). Lorsque l'on parle de séquencer l'ADN, il s'agit donc d'établir la longue suite de nucléotides pour aboutir à une séquence du type : TTCAGTTCGAACTGAACCTGCA…

En 2010, un laboratoire de recherche avait réussi à synthétiser chimiquement le premier ADN complet, assemblé à partir de données numériques (voir cet excellent article d'AxiomCafé qui décrit très bien le procédé), et inséré dans une cellule vivante. Deux ans plus tard, l'équipe de George Church a réalisé le même type d'expérience, mais avec cette fois pour objectif d'utiliser l'ADN pour stocker des informations de façon stable, avec une capacité de stockage inégalée – selon Science, un seul gramme d'ADN peut contenir "des milliards de gigaoctets de données".

Pour réussir leur prouesse, les chercheurs n'ont pas utilisé de cellules vivantes, qui sont trop instables pour assurer l'intégrité des données, mais une imprimante chargée de déposer des fragments d'ADN synthétisé sur une petite surface en verre. A la place du langage binaire (0 et 1) utilisé traditionnellement dans l'informatique, les 5,37 mégaoctets de données du livre de génétique co-écrit par George Church ont été encodés selon l'alphabet de l'ADN, en séquences de A, C, T et G. Chacun des fragments possédait par ailleurs une en-tête permettant d'identifier sa place dans l'ensemble du "fichier". 

A l'aide d'un séquenceur d'ADN (qui n'est pas prêt d'arriver chez monsieur-tout-le-monde), les chercheurs ont alors pu relire les données qu'ils avaient imprimées sous forme d'ADN synthétisé, et les ré-ordonner. Le plus spectaculaire est qu'ils n'ont constaté qu'un taux d'erreurs de 2 erreurs par millions de bits, soit un résultat "équivalent aux DVD et bien meilleur que les disques dur magnétiques".

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+

Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !