Gemini 2.5 : Google muscle son IA légère, mais garde la recette secrète :)

Le 26 mars 2025, Google a annoncé en grande pompe le lancement de Gemini 2.5, la dernière évolution de son modèle de langage, avec une mission claire : dominer la catégorie des LLM légers. Dans un article de Neowin aussi enthousiaste qu’un communiqué marketing, on apprend que ce nouveau modèle surclasse la concurrence — DeepSeek R1, OpenAI O3 Mini, et autres — dans une série de benchmarks soigneusement sélectionnés… d’où le questionnement de bons nombres d’analystes.
Gemini 2.5 est le dernier-né des modèles IA de Google, dans une gamme censée être plus compacte, plus rapide, mais toujours intelligente. Il se veut idéal pour des applications embarquées, mobiles ou nécessitant des temps de réponse réduits.
Et selon Google, le nouveau venu ne fait pas les choses à moitié :
- Il bat DeepSeek R1 sur 6 des 8 benchmarks mentionnés.
- Il écrase O3 Mini d’OpenAI, notamment sur MMLU, GSM8K, HumanEval et DROP.
- Il surpasse Claude Haiku sur tous les tests, sauf un.
L’arène des “petits modèles efficaces” est donc bien lancée. Mais Google joue-t-il franc jeu ?
Il est important de souligner que Gemini 2.5 n’est pas comparé à GPT-4 ou Claude 3, mais à des modèles compacts, typiquement inférieurs à 10 milliards de paramètres.
Pourquoi ? Parce que Gemini 2.5 vise les applications mobiles, embarquées ou économiques en ressources. Dans cette catégorie, la rapidité compte presque autant que la justesse. Et bien entendu aussi la puissance (et énergie) nécessaire, on ne peut avoir ici une puissance de calcul de folie…
Google indique que Gemini 2.5 est en cours de déploiement pour ses services cloud et dans l’écosystème Android. Il n’est pas encore disponible en open source ou via une API standard. Le modèle devrait apparaître dans Bard, Android, Google Workspace, voire Chrome. Une manière d’injecter de l’IA partout, même là où on ne l’a pas demandée 🙂
Nous y reviendrons lors du prochain Briefing