Après les échecs et StarCraft, l'IA de Google s'attaque à l'un des plus grands mystères de la science

Google DeepMind, l’entreprise spécialisée en intelligence artificielle de Google, tente de démêler un des plus grands mystères de la science : le repliement des protéines. En jeu, la compréhension du vivant et de potentielles solutions en faveur de l’environnement et contre les maladies.

La récréation est finie pour DeepMind. Après avoir battu les humains sur des jeux complexes comme les échecs et le jeu de go, l’entreprise de recherche en intelligence artificielle de Google va s’intéresser à un enjeu clé de la recherche en biologie. Ses IA vont être entraînées à prédire la forme 3D des protéines, en fonction des acides aminés qui les composent, a annoncé l’entreprise sur son site, le dimanche 2 décembre. En cas de succès, ces prédictions permettraient de mieux appréhender la quasi-totalité des problèmes des organismes vivants.

« C’est notre premier investissement majeur en termes de ressources, financières et humaines, pour un problème scientifique, fondamental, très important et ancré dans la réalité », abonde Damis Hassabis, co-fondateur et CEO de DeepMind dans le communiqué du groupe. L’IA Alpha Go s’était occupée de battre les champions du jeu de plateau chinois, Alpha Fold se chargera de mieux prédire les formes tridimensionnelles des protéines que les meilleurs chercheurs.

Comprendre le repliement des protéines pour comprendre le vivant

« Les protéines sont des molécules microscopiques à l’intérieur des cellules, qui effectuent diverses fonctions essentielles », rappelle une publication de l’université d’Harvard. Le rôle d’une protéine et les tâches qu’elle effectuera dépendent de la forme qu’elle prend.

Chaque cellule humaine contient entre 20 000 et 100 000 types de protéines uniques. Les protéines sont des chaînes d’acides aminés — elles en comptent 300 en moyenne — dont l’ordre détermine comment la chaîne se replie. Car oui, les protéines se replient, et c’est même cette propriété qui leur permet de se distinguer les unes des autres et d’avoir un rôle si précis.

Alpha Fold a pour mission de prédire la forme tridimensionnelle des protéines.

Source : Deepmind

Autrement dit, avec la même composition, 2 protéines peuvent avoir 2 fonctions différentes si leurs formes divergent. Un repliement peut s’effectuer entre chaque acide aminé, ce qui mène à un nombre extrêmement grand — de l’ordre de 1 suivi de 300 zéros — de combinaisons et de structures différentes.

Problèmes : les protéines ratent régulièrement leur repliement — pour diverses raisons connues et inconnues — et ne remplissent ainsi plus le rôle auquel elles étaient destinées. Même si l’organisme dispose d’un système d’auto-régulation — opéré par d’autres protéines –, ces défauts sont à l’origine de nombreuses maladies, comme le diabète, le syndrome de Marfan ou la maladie d’Alzheimer.

Alpha Fold, nouvelle bête de compétition… scientifique

Pour essayer de mieux comprendre ces phénomènes, les chercheurs organisent des concours de prédictions de la forme des protéines. Deux fois par an se tient le Critical assesment of structure prediction, une compétition accessible aux meilleurs groupes de recherche mondiaux. Les équipes doivent prédire les structures de protéines récemment découvertes, mais pas encore rendues publiques, en fonction de leur composition en acides aminés. L’équipe la plus proche de la réalité gagne.

Alpha Fold a écrasé sa première compétition, présentant la prédiction la plus précise pour 25 des 43 structures proposées. Les seconds du classement de 98 équipes n’ont été les plus précis que 3 fois.

En 2016, Alpha Go remportait toutes ses parties de jeu de Go contre les meilleurs joueurs du monde.

Source : Deepmind

DeepMind a entraîné ses réseaux neuronaux à partir des données sur les milliers de protéines connues. AlphaFold prend notamment en compte la distance entre les acides aminés et mesure la valeur des angles formés par les replis. Ensuite, l’IA identifie quelle est la disposition qui demandera le moins d’énergie, car c’est ainsi que se comportent les protéines, la majorité du temps.

Combattre des maladies, mieux recycler

Depuis le début du programme, lancé à la suite du succès de Alpha Go en 2016, l’IA a gagné en rapidité dans ses prédictions. Alors qu’il lui fallait auparavant une nuit de calcul, elle peut aujourd’hui les sortir en quelques heures.

Certes, ces prédictions ne sont qu’une première étape vers une compréhension plus pointue du fonctionnement des protéines. Mais si les chercheurs parviennent à trouver la causalité entre la composition des protéines et leur repliement, ils pourraient lever de nombreux mystères, comme identifier quels repliement sont à l’origine de maladies.

Et ils pourraient aussi créer des protéines avec des rôles précis, pour résoudre des problèmes dans les secteurs de la santé ou de l’écologie. Par exemple, on pourrait imaginer une protéine qui permettrait un recyclage efficace du plastique, ou on pourrait fournir les protéines manquantes aux personnes atteintes d’Alzheimer. Mais ces ambitions restent de l’ordre hypothétique… pour l’instant.

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Marre des réseaux sociaux ? Rejoignez la communauté Numerama sur WhatsApp !

Google

Télécharger gratuitement