Simulation moléculaire dans la chimie pharmaceutique.
• Les deux partenaires ont bénéficié de la puissance de calcul haute performance de GENCI, EuroHPC et Argonne National Laboratory pour générer la plus précise base de données synthétiques au monde pour la chimie pharmaceutique.
• Cette base de données a permis de développer
un modèle d’intelligence artificielle de fondation alliant rapidité et
précision des simulations moléculaires. Ce dernier pourrait permettre de
réduire massivement le stade de la synthèse chimique dans la recherche de
nouveaux médicaments et de découvrir de nouveaux mécanismes d’action.
• Les applications potentielles permettent de
dépasser le seul secteur pharmaceutique et concernent la chimie pour les
sciences de la vie dans son ensemble telles que, par exemple l’optimisation
d’enzymes industrielles, la cosmétique, etc.
Qubit Pharmaceuticals,
société deeptech spécialisée dans la découverte de nouveaux candidats
médicaments, annonce avec Sorbonne Université la mise en service de
FeNNix-Bio1, un modèle de fondation (modèle d'intelligence artificielle de
grande taille, entraîné sur une grande quantité de données) capable de
modéliser et simuler le comportement des molécules avec une précision, et une
rapidité de calcul jamais atteintes jusqu’à présent. Une avancée majeure qui
vient de faire l’objet de deux prépublications.
La précision est telle
qu’elle pourrait réduire massivement le stade coûteux de l’expérimentation en
laboratoire dans le développement de nouvelles molécules. « Cette méthode de
simulation réduirait très fortement le coût de la phase de découverte d'un
médicament », déclare Jean-Philip Piquemal, professeur à Sorbonne
Université et directeur du Laboratoire de Chimie Théorique (Sorbonne
Université/CNRS), co-fondateur et directeur scientifique de Qubit
Pharmaceuticals.
Pour ce faire,
FeNNix-Bio1 est entraîné sur la base de données la plus précise au monde en
chimie moléculaire, développée ces derniers mois grâce à la puissance de calcul
haute performance de GENCI, EuroHPC et Argonne National Laboratory. En
pratique, cette dernière est constituée d’un ensemble de plusieurs millions de
briques élémentaires des biomolécules, simulées à la plus haute précision
chimique possible. En s’entraînant sur ces briques élémentaires, le modèle de
fondation apprend les lois de la chimie et de la physique, et peut reconstituer
des biomolécules à la manière d’un lego. Il apprend ainsi comment les molécules
interagissent entre elles.
Modélisation
moléculaire à haute-résolution grâce à l’IA
FeNNix-Bio1 a notamment
prouvé son efficacité en réussissant l'une des tâches les plus difficiles de la
modélisation moléculaire : la simulation du comportement physique de l'eau dans
ses différentes phases. En effet, le modèle de fondation permet de prédire avec
précision différentes propriétés physiques, de reproduire le comportement des
ions et des petites molécules organiques en solution avec une fidélité
remarquable là où les autres modèles de référence en sont incapables. Cette
tâche est essentielle car l’eau le solvant présent dans le corps humain et son
interaction avec des médicaments joue un rôle clé dans leur activité.
FeNNix-Bio1 ouvre la
voie à la prise en compte de la réactivité chimique en pharmacie
Une des particularités
du modèle est sa capacité à modéliser la réactivité des molécules c’est-à-dire
de créer ou de casser des liaisons chimiques, ce que les logiciels de
simulation traditionnels ne peuvent pas faire. Ce faisant, FeNNix-Bio1 rend
possible la conception de médicaments covalents (qui se lient directement à la
cible à travers la création d’une liaison chimique) comme le Paxlovid ou
l’Ibrutinib par exemple.
Étendre la révolution
d’AlphaFold, le modèle de Google DeepMind, en allant de la chimie jusqu’à la
biologie grâce aux données synthétiques
L’équipe de recherche
de Sorbonne Université qui a développé FeNNix-Bio1 s’est notamment donné pour
objectif d’aller au-delà des capacités d’algorithmes de type d’AlphaFold, le
logiciel d’intelligence artificielle développé par Google DeepMind, qui fournit
une prédiction de la structure des protéines à partir de leur séquence en
acides aminés. Mais FeNNix-Bio1 va plus loin. « AlphaFold a révolutionné la
prédiction de la structure des protéines. Cependant, ces dernières ne sont pas
statiques et leurs structures évoluent au cours du temps modifiant les
interactions avec les médicaments. FeNNix-Bio1 permet de modéliser ces effets
dynamiques. De plus, AlphaFold ne permet pas de modéliser précisément les
interactions des protéines avec des candidats médicaments. FeNNix-Bio1 répond à ces deux limites
importantes pour la simulation biomoléculaire », explique Jean-Philip
Piquemal. Grâce à l’interaction entre ces deux modèles il est possible de
passer de la prédiction de structure de nouvelles cibles à la découverte de
médicaments qui interagissent avec elles grâce à l’IA.
Un champ des possibles
sans précédent dans la simulation moléculaire
FeNNix-Bio1 ne
représente pas un simple gain marginal, mais une nouvelle approche de la
science moléculaire. Là où les simulations traditionnelles sont limitées en
termes de précision, de vitesse et de domaines d’applicabilité, et les modèles
de chimie quantique sont précis mais lents et trop coûteux en temps de calcul
pour une mise en œuvre à grande échelle, FeNNix-Bio1 offre une précision de
niveau quantique tout en restant évolutif et économique. Le modèle de fondation
ne se contente pas de prédire la structure, il comprend comment les molécules
se comportent et interagissent.
Un espace chimique
quasi-infini à explorer
Prédire la capacité
d’un médicament à se lier à une protéine (ou à l’ARN et à l’ADN) est l’une des
tâches les plus complexes dans la découverte de médicaments. L’espace chimique
est en effet quasi illimité. On peut concevoir un nombre infini de molécules
médicamenteuses et les introduire dans un nombre infini de cibles (environ 100
000). Il existe ainsi des trillions de combinaisons possibles, et il est
impossible de les intégrer toutes dans une base de données.
Une des
caractéristiques les plus enthousiasmante est son potentiel à réduire
l'expérimentation en laboratoire et à permettre l'exploration de candidats
médicaments plus innovants pour s'attaquer à des cibles complexes voire
considérées comme impossible à moduler jusqu’à présent. « Comme le modèle
est aussi précis que l'expérience, nous pouvons générer énormément d’idées
nouvelles, échouer rapidement et à peu de frais « in silico » avant de passer
aux tests en laboratoire avec les molécules qui ont passé les tests avec succès
», poursuit Jean-Philip Piquemal
Pour ce faire, les
chercheurs de FeNNix-Bio1 ont développé des approches de type réseau de
neurones adaptées aux applications en chimie et en physique, plutôt que
d'utiliser des architectures de types LLMs (Large Langage Model), généralement
optimisés pour reconnaître et générer du texte. Plus précis et moins cher,
FeNNix-Bio1 peut être entraîné en quelques heures à l'aide d'un GPU standard,
alors que d'autres modèles IA requièrent des semaines de temps de
supercalculateur.
Une révolution qui
dépasse le secteur pharmaceutique et couvre toute la chimie
FeNNix-Bio1 constitue
donc un modèle performant et évolutif pour la découverte de médicaments. « Nous
visons les cibles complexes, celles pour lesquelles l’industrie pharmaceutiques
n’apporte pas de solution aux malades », commente Robert Marino, PDG de Qubit
Pharmaceuticals. Qubit Pharmaceuticals a aujourd’hui un pipeline de 7
programmes, en particulier en oncologie et dans l’inflammation. Le programme le
plus avancé concerne le cancer du sein.
La mise en service de
ce nouveau modèle de fondation ouvre de nouvelles perspectives. En effet, sa
polyvalence, rapidité et précision positionne Qubit Pharmaceuticals au-delà du
seul secteur pharmaceutique. Les applications potentielles dans le secteur de
la chimie incluent la conception d’enzymes industrielles, l’optimisation de
membranes pour la désalinisation, le développement de batteries de nouvelle
génération, ou encore l’accélération de la chimie verte. Ancré dans les lois de
la physique, le modèle est adaptable : en changeant les blocs de construction
moléculaires, il est possible de simuler n’importe quel système.
FeNNix-Bio1 ouvre aussi
la voie à l’IA quantique – la convergence entre calcul quantique et
apprentissage automatique, qui promet de révolutionner la génération de données
pour les simulations moléculaires. Qubit Pharmaceuticals utilise déjà des
données issues du quantique pour enrichir ses modèles – ce que l’on pensait
longtemps impossible avant un horizon 2035 nous partage Jean-Philip Piquemal.
FeNNix-Bio1 est un changement de paradigme dans la conception, le test et la validation de molécules. Avec FeNNix-Bio1, on ne va pas seulement plus vite, on est plus innovant, plus efficace et l’on peut passer à l’échelle dans plusieurs secteurs industriels. Avec la convergence de l’IA et du calcul haute performance permettant de simuler la biologie et la chimie à large échelle ainsi que le développement de l'informatique quantique qui fait voler en éclats les limites de la physique, la vision tant attendue de la découverte automatisée de molécules devient une réalité à un rythme accéléré.