TxGemma : Google dope la recherche pharmaceutique à l’IA open source

Dans un secteur où 90 % des molécules échouent au-delà de la phase 1 des essais cliniques, la recherche thérapeutique ressemble souvent à une ruée vers l’or… sans carte. Google pense avoir trouvé la boussole : TxGemma, son dernier modèle d’intelligence artificielle ouvert dédié à l’accélération du développement de médicaments. Successeur de Tx-LLM, TxGemma promet de prédire, générer, classer, et même dialoguer avec les chercheurs pour leur faire gagner un temps précieux (et quelques milliards).
Une étude de 2022 publiée par la National Library of Medicine révèle que 9 molécules sur 10 échouent après la phase 1des essais. Et chaque échec coûte des années et des milliards.
Le constat est connu mais toujours alarmant : développer un médicament prend en moyenne 10 à 15 ans, avec un taux d’échec stratosphérique. Et ce, malgré les technologies, la data, les plateformes cloud et les modélisations biochimiques. C’est ici que l’IA peut jouer un rôle pivot : en détectant plus tôt les failles, en prédictant les résultats d’essais cliniques, ou en guidant les chercheurs vers les cibles les plus prometteuses. Autrement dit : éviter d’investir dans des impasses moléculaires.
TxGemma est un modèle open-source fondé sur Gemma, entraîné spécifiquement pour aider à développer des thérapeutiques, et doté de capacités prédictives, génératives et analytiques.
Contrairement aux modèles généralistes (comme Gemini ou GPT), TxGemma est taillé selon Google pour les applications bio-pharmaceutiques. Il sait :
- Classer une molécule (va-t-elle traverser la barrière hémato-encéphalique ?)
- Prédire une affinité de liaison
- Générer des structures chimiques à partir de résultats attendus
Ce n’est pas seulement un chatbot qui sort des PDF scientifiques : c’est une boîte à outils pour anticiper l’efficacité ou l’échec d’une molécule. Et Google l’a bien compris en fournissant plusieurs tailles de modèles, pour différents usages et ressources matérielles.
TxGemma est décliné en trois tailles : 2B, 9B et 27B de paramètres, avec une version spéciale dite predict pour les tâches bio-pharmaceutiques ciblées. TxGemma existe aussi en version Chat, en 9B et 27B, capable de raisonnement explicite et de dialogue scientifique.
Une IA qui vous répond, c’est bien. Une IA qui vous explique pourquoi elle prédit un échec clinique, c’est mieux. TxGemma-Chat se veut interprétable, capable de décrire ses raisonnements.
Exemple : au lieu de dire simplement « cette molécule ne fonctionnera pas », elle pourra expliquer « parce que sa conformation bloque la liaison au récepteur X selon les données Y ». Une pédagogie algorithmique bienvenue dans un domaine où l’opacité peut être fatale.
Agentic-Tx : Google combine IA, recherche et raisonnement
Basé sur Gemini 2.0 Pro, Agentic-Tx combine 18 outils spécialisés pour accompagner les chercheurs : génomique, recherche PubMed, raisonnement moléculaire… Google propose ici une approche multi-agents intégrée, où TxGemma agit en chef d’orchestre IA. On y retrouve :
- Des outils de recherche scientifique
- Des bases de données comme PubMed ou Wikipédia
- Des modules pour gènes, protéines et interactions moléculaires
Objectif : permettre des chaînes de raisonnement complexes, avec des mises à jour continues et un accès à l’information la plus pertinente. Une sorte de copilot moléculaire boosté au search engine 🙂

En Open Source !
Les modèles sont disponibles sur Vertex AI Model Garden et Hugging Face, et sont open-source.
Google joue ainsi la carte de l’ouverture pour créer un effet d’écosystème. Les chercheurs peuvent affiner le modèle, publier des versions améliorées, ou l’intégrer à des pipelines internes. En clair : Google veut créer le Linux de la modélisation thérapeutique — et se positionner au cœur de l’innovation future.
Mais attention : l’open-source ne signifie pas gratuité totale (le cloud, lui, reste bien facturé), ni validation scientifique immédiate. Des garde-fous seront essentiels là encore pour éviter les dérives d’interprétation ou d’usage.
TxGemma est une avancée sérieuse, et probablement l’une des initiatives IA les plus stratégiques de Google côté santé. Son potentiel est immense : réduction des coûts, accélération des essais, démocratisation de la R&D.
Mais il ne faut pas oublier que l’IA ne remplace ni les essais cliniques, ni l’éthique, ni le jugement humain. Elle peut guider, proposer, éclairer, mais pas encore certifier un médicament. Et comme tout outil, son efficacité dépendra comme chaque IA spécialisée, surtout de la main (et la tête) qui s’en sert…
Nous reviendrons sur tout ceci dans une session spéciale « Retours d’Expérience » lors du prochain Briefing Calipia.