Multi-Cloud ou infidélité ? Pourquoi Perplexity délaisse (un peu) AWS pour Microsoft Azure.

C’est ce qu’on appelle un retour de bâton marketing assez savoureux. Perplexity, l’enfant chéri d’Amazon Web Services (AWS) — au point d’être érigé en étude de cas officielle pour démontrer la puissance des instances EC2 P4de et de SageMaker — vient de signer un chèque de 750 millions de dollars à la concurrence. Pour les DSI qui croyaient encore à la fidélité éternelle envers un fournisseur cloud unique, cet accord de trois ans avec Microsoft Azure sonne comme une fin de lune de miel brutale.

Techniquement, ce mouvement est fascinant. Perplexity ne quitte pas AWS (ils gardent l’infrastructure de base), mais ils déportent l’intelligence chez Satya Nadella. En intégrant le service « Foundry » de Microsoft, la startup s’offre un accès privilégié aux modèles de frontière d’OpenAI, de xAI et même d’Anthropic (ironiquement déjà disponible sur AWS via Bedrock, mais bon…).

D’un point de vue d’architecte, on peut se poser la question : pourquoi complexifier sa stack avec un tel contrat ? La réponse réside dans la fragmentation des LLM. AWS s’est enfermé dans une relation quasi exclusive avec Anthropic, là où Microsoft joue désormais la carte du supermarché des LLM. En payant 750 millions de dollars, Perplexity n’achète pas seulement des jetons d’inférence, ils achètent une assurance contre l’obsolescence d’un modèle unique. C’est une stratégie de « Model-as-a-Service » (MaaS) poussée à l’extrême, où l’on préfère payer le prix fort pour la diversité plutôt que d’optimiser sur une plateforme unique.

Cependant, ne soyons pas dupes. Derrière l’agilité technique se cache une réalité plus cynique. Microsoft utilise son service Foundry comme un cheval de Troie pour siphonner les workloads IA les plus prestigieux de ses concurrents. Pour un DSI, le message est clair : la portabilité est un mythe, mais la redondance contractuelle est la nouvelle norme. Bonne chance aux équipes Ops qui devront gérer la latence entre les données stockées sur S3 et l’inférence tournant sur Azure. L’architecture hybride a bon dos quand il s’agit surtout de satisfaire des accords commerciaux de haut vol.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.