La récréation est finie pour DeepMind. Après avoir battu les humains sur des jeux complexes comme les échecs et le jeu de go, l’entreprise de recherche en intelligence artificielle de Google va s’intéresser à un enjeu clé de la recherche en biologie. Ses IA vont être entraînées à prédire la forme 3D des protéines, en fonction des acides aminés qui les composent, a annoncé l’entreprise sur son site, le dimanche 2 décembre. En cas de succès, ces prédictions permettraient de mieux appréhender la quasi-totalité des problèmes des organismes vivants.
« C’est notre premier investissement majeur en termes de ressources, financières et humaines, pour un problème scientifique, fondamental, très important et ancré dans la réalité », abonde Damis Hassabis, co-fondateur et CEO de DeepMind dans le communiqué du groupe. L’IA Alpha Go s’était occupée de battre les champions du jeu de plateau chinois, Alpha Fold se chargera de mieux prédire les formes tridimensionnelles des protéines que les meilleurs chercheurs.
Comprendre le repliement des protéines pour comprendre le vivant
« Les protéines sont des molécules microscopiques à l’intérieur des cellules, qui effectuent diverses fonctions essentielles », rappelle une publication de l’université d’Harvard. Le rôle d’une protéine et les tâches qu’elle effectuera dépendent de la forme qu’elle prend.
Chaque cellule humaine contient entre 20 000 et 100 000 types de protéines uniques. Les protéines sont des chaînes d’acides aminés — elles en comptent 300 en moyenne — dont l’ordre détermine comment la chaîne se replie. Car oui, les protéines se replient, et c’est même cette propriété qui leur permet de se distinguer les unes des autres et d’avoir un rôle si précis.
Autrement dit, avec la même composition, 2 protéines peuvent avoir 2 fonctions différentes si leurs formes divergent. Un repliement peut s’effectuer entre chaque acide aminé, ce qui mène à un nombre extrêmement grand — de l’ordre de 1 suivi de 300 zéros — de combinaisons et de structures différentes.
Problèmes : les protéines ratent régulièrement leur repliement — pour diverses raisons connues et inconnues — et ne remplissent ainsi plus le rôle auquel elles étaient destinées. Même si l’organisme dispose d’un système d’auto-régulation — opéré par d’autres protéines –, ces défauts sont à l’origine de nombreuses maladies, comme le diabète, le syndrome de Marfan ou la maladie d’Alzheimer.
Alpha Fold, nouvelle bête de compétition… scientifique
Pour essayer de mieux comprendre ces phénomènes, les chercheurs organisent des concours de prédictions de la forme des protéines. Deux fois par an se tient le Critical assesment of structure prediction, une compétition accessible aux meilleurs groupes de recherche mondiaux. Les équipes doivent prédire les structures de protéines récemment découvertes, mais pas encore rendues publiques, en fonction de leur composition en acides aminés. L’équipe la plus proche de la réalité gagne.
Alpha Fold a écrasé sa première compétition, présentant la prédiction la plus précise pour 25 des 43 structures proposées. Les seconds du classement de 98 équipes n’ont été les plus précis que 3 fois.
DeepMind a entraîné ses réseaux neuronaux à partir des données sur les milliers de protéines connues. AlphaFold prend notamment en compte la distance entre les acides aminés et mesure la valeur des angles formés par les replis. Ensuite, l’IA identifie quelle est la disposition qui demandera le moins d’énergie, car c’est ainsi que se comportent les protéines, la majorité du temps.
Combattre des maladies, mieux recycler
Depuis le début du programme, lancé à la suite du succès de Alpha Go en 2016, l’IA a gagné en rapidité dans ses prédictions. Alors qu’il lui fallait auparavant une nuit de calcul, elle peut aujourd’hui les sortir en quelques heures.
Certes, ces prédictions ne sont qu’une première étape vers une compréhension plus pointue du fonctionnement des protéines. Mais si les chercheurs parviennent à trouver la causalité entre la composition des protéines et leur repliement, ils pourraient lever de nombreux mystères, comme identifier quels repliement sont à l’origine de maladies.
Et ils pourraient aussi créer des protéines avec des rôles précis, pour résoudre des problèmes dans les secteurs de la santé ou de l’écologie. Par exemple, on pourrait imaginer une protéine qui permettrait un recyclage efficace du plastique, ou on pourrait fournir les protéines manquantes aux personnes atteintes d’Alzheimer. Mais ces ambitions restent de l’ordre hypothétique… pour l’instant.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.