NVIDIA et Evozyne créent un modèle d’IA pour les protéines | Actualité Jeux Vidéo

Written By Jeanne Petit

Je suis rédacteur pour BeepGameCenter.

À l’aide d’un modèle d’IA pré-entraîné de NVIDIA, la startup Evozyne a créé deux protéines à fort potentiel dans le domaine de la santé et de l’énergie propre.

Un document conjoint publié aujourd’hui décrit le processus et les éléments de base biologiques qu’il a produits. L’un vise à guérir une maladie congénitale, un autre est conçu pour consommer du dioxyde de carbone afin de réduire le réchauffement climatique.

Les premiers résultats montrent une nouvelle façon d’accélérer la découverte de médicaments et plus encore.

« C’est vraiment encourageant que même dans ce premier cycle, le modèle d’IA ait produit des protéines synthétiques aussi bonnes que celles d’origine naturelle », a déclaré Andrew Ferguson, co-fondateur d’Evozyne et co-auteur de l’article. « Cela nous indique qu’il a correctement appris les règles de conception de la nature. »

Un modèle d’IA transformationnel

Evozyne a utilisé l’implémentation NVIDIA de ProtT5, un modèle de transformateur qui fait partie de NVIDIA BioNeMo, un cadre logiciel et un service pour créer des modèles d’IA pour les soins de santé.

« BioNeMo nous a vraiment donné tout ce dont nous avions besoin pour prendre en charge la formation de modèles, puis exécuter des tâches avec le modèle à très peu de frais – nous pouvions générer des millions de séquences en quelques secondes seulement », a déclaré Ferguson, un ingénieur moléculaire travaillant à l’intersection de la chimie et de l’apprentissage automatique. .

Le modèle est au cœur du processus d’Evovyne appelé ProT-VAE. C’est un flux de travail qui combine BioNeMo avec un auto-encodeur variationnel qui agit comme un filtre.

« L’utilisation de grands modèles de langage combinés à des auto-encodeurs variationnels pour concevoir des protéines n’était sur le radar de personne il y a quelques années à peine », a-t-il déclaré.

Lisez aussi :  NVIDIA et Dell Technologies élargissent leur portefeuille d'IA | Actualité Jeux Vidéo

Le modèle apprend les voies de la nature

Comme un étudiant lisant un livre, le modèle de transformateur de NVIDIA lit les séquences d’acides aminés dans des millions de protéines. En utilisant les mêmes techniques que les réseaux de neurones utilisent pour comprendre le texte, il a appris comment la nature assemble ces puissants éléments constitutifs de la biologie.

Le modèle a ensuite prédit comment assembler de nouvelles protéines adaptées aux fonctions qu’Evozyne souhaite aborder.

« La technologie nous permet de faire des choses qui n’étaient que des rêves illusoires il y a 10 ans », a-t-il déclaré.

Une mer de possibilités

L’apprentissage automatique aide à naviguer dans le nombre astronomique de séquences de protéines possibles, puis identifie efficacement les plus utiles.

La méthode traditionnelle d’ingénierie des protéines, appelée évolution dirigée, utilise une approche lente, aléatoire. Il ne modifie généralement que quelques acides aminés en séquence à la fois.

En revanche, l’approche d’Evozyne peut modifier la moitié ou plus des acides aminés d’une protéine en un seul cycle. C’est l’équivalent de faire des centaines de mutations.

« Nous faisons des sauts énormes qui nous permettent d’explorer des protéines jamais vues auparavant qui ont des fonctions nouvelles et utiles », a-t-il déclaré.

En utilisant le nouveau procédé, Evozyne prévoit de construire une gamme de protéines pour lutter contre les maladies et le changement climatique.

Réduction du temps de formation, mise à l’échelle des modèles

« NVIDIA a été un partenaire incroyable dans ce travail », a-t-il déclaré.

« Ils ont adapté les tâches à plusieurs GPU pour accélérer la formation », a déclaré Joshua Moller, data scientist chez Evozyne. « Nous parcourions des ensembles de données entiers chaque minute. »

Lisez aussi :  Magic Eden lance l'outil Solana NFT pour appliquer les redevances des créateurs

Cela a réduit le temps de formation de grands modèles d’IA de plusieurs mois à une semaine. « Cela nous a permis de former des modèles – certains avec des milliards de paramètres entraînables – qui ne seraient tout simplement pas possibles autrement », a déclaré Ferguson.

Beaucoup plus à venir

L’horizon de l’ingénierie des protéines accélérée par l’IA est large.

« Le domaine évolue incroyablement rapidement, et je suis vraiment impatient de voir ce qui va suivre », a-t-il déclaré, notant la récente montée en puissance des modèles de diffusion.

« Qui sait où nous en serons dans cinq ans. »