Text-to-video : Microsoft rattrape Google et AWS avec l’intégration de Sora dans Azure

Avec l’annonce faite à Build 2025, Microsoft semble vouloir combler un manque majeur dans son offre Azure AI Foundry. La plateforme qui regroupe plus de 1 900 modèles d’IA destinés à des cas d’usages variés dans l’industrie, souffrait d’un retard criant : aucun modèle de génération vidéo n’était jusqu’ici disponible.

Ce vide contrastait fortement avec l’avance prise par AWS, qui propose déjà Nova Reels API, et Google Cloud, qui a présenté récemment Veo API, tous deux capables de transformer des prompts textuels en vidéos. Microsoft, jusqu’à présent, ne pouvait compter que sur une alliance stratégique avec OpenAI pour maintenir son leadership dans le domaine des modèles dits “frontière”. Un partenariat qui, bien qu’étroit, n’avait pas encore permis d’offrir Sora, le modèle de génération vidéo d’OpenAI, sous forme d’API publique.

Dévoilé en décembre 2024, Sora avait jusqu’alors été cantonné à une démonstration limitée dans ChatGPT Premium, à destination des utilisateurs finaux. La raison ? Un besoin colossal en GPU, difficile à industrialiser pour une mise à disposition généralisée. Malgré l’intérêt manifeste et les capacités impressionnantes du modèle, OpenAI a tardé à proposer une API pour les développeurs, freinant toute adoption massive.

C’est désormais chose faite, ou presque. À partir de la semaine prochaine, Sora sera disponible dans Azure AI Foundry, à travers une nouvelle section baptisée “Video Playground”, conçue pour permettre aux développeurs de tester, expérimenter et intégrer facilement la génération vidéo dans leurs flux de travail.

L’annonce est accessible en vidéo ici, pour ceux qui préfèrent le format visuel au communiqué officiel.

Un Video Playground prometteur… mais expérimental

Le Video Playground introduit des fonctionnalités essentielles :

  • Choix du format (aspect ratio),
  • Réglage de la résolution,
  • Définition de la durée des vidéos générées.

Microsoft promet également l’intégration directe de Sora dans Azure OpenAI Service, permettant ainsi une intégration fluide dans les applications via API. En résumé, un pas en avant important pour les architectes et les DSI désireux d’automatiser ou de prototyper des expériences narratives, marketing ou industrielles.

Mais le scepticisme reste permis. Aucune mention claire des coûts d’usage, ni des limitations techniques (latence, file d’attente GPU, quotas) n’a été faite pour l’instant. Et surtout : aucun modèle concurrent n’est proposé sur Foundry, ce qui limite la liberté de choix des développeurs.

le vrai début de la vidéo IA chez Microsoft ?

L’arrivée de Sora sur Azure marque un tournant. Non seulement parce que Microsoft comble une lacune technique évidente, mais surtout parce que cela pourrait amorcer une intégration plus large des IA génératives dans les workflows créatifs et métiers. Toutefois, il reste à voir :

  • Dans quelle mesure la solution est scalable,
  • À quel prix elle sera accessible,
  • Et si Microsoft compte un jour proposer des modèles alternatifs pour encourager l’innovation et la concurrence interne.

Un pas dans la bonne direction, donc… mais le marathon de l’IA générative vidéo ne fait que commencer.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.