Microsoft, Meta, xAI : l’employé-cobaye, nouveau filon de l’entraînement des modèles…

La course aux données d’entraînement prend un tour particulièrement intéressant : après avoir aspiré (souvent sans autorisation…) une bonne partie du web public, les grands acteurs de l’IA se retournent vers leurs propres salariés. Moins coûteux à convaincre que des clients, et surtout incapables légalement de refuser, les employés constituent une source de données fraîches, propriétaires et potentiellement très qualitatives. Tour d’horizon d’une tendance qui soulève des questions profondes sur la frontière entre contrat de travail et don de soi numérique.

Microsoft et GitHub Copilot : le pari du terrain de jeu interne

GitHub Copilot a longtemps été présenté comme le leader incontesté de l’assistance au développement par IA. Cette position s’est sensiblement érodée face à des concurrents comme Cursor ou Claude Code d’Anthropic, qui ont su séduire les développeurs par des expériences plus fluides et des modèles plus performants sur les tâches de codage complexes.

Microsoft a décidé de jouer une carte que ses rivaux n’ont pas : une armée interne de quelque 100 000 ingénieurs logiciels. L’idée est simple dans sa logique, redoutable dans ses implications. En équipant ses développeurs de GitHub Copilot via VSCode, Microsoft collecte non seulement du code propriétaire de haute valeur, mais surtout les signaux humains associés : quelles suggestions de code sont acceptées, lesquelles sont modifiées, lesquelles sont rejetées. Ce signal d’approbation humain constitue précisément le type de donnée RLHF (Reinforcement Learning from Human Feedback) que tous les labs peinent à obtenir en quantité et en qualité suffisantes.

À cela s’ajoute une source inattendue mais logique : le code source des jeux vidéo développés par les studios Xbox. Des millions de lignes de code de jeu, représentant des décennies de savoir-faire en développement temps réel, graphique et réseau, versées dans le pipeline d’entraînement. Un actif que ni Anthropic, ni OpenAI, ni Mistral ne possèdent.

La politique interne de Microsoft va jusqu’à décourager activement l’utilisation de Claude Code ou d’autres outils concurrents au profit de Copilot, ce qui, au-delà de l’aspect commercial évident, sert directement la stratégie de collecte de données…

Meta et le « Model Capability Initiative » : la surveillance assumée

De son côté, Meta a adopté une approche nettement plus invasive (quelle surprise !), et visiblement moins bien reçue. Le programme baptisé Model Capability Initiative (MCI) installe sur les postes des employés un outil qui capture mouvements de souris, clics, et comportements de navigation. Mark Zuckerberg aurait justifié cette collecte par la qualité intrinsèque de ses salariés, tous « très intelligents » selon lui, ce qui rendrait leurs comportements particulièrement précieux pour entraîner des agents IA capables d’assister des humains sur des tâches informatiques courantes.

La réaction interne n’a pas été enthousiaste. Plusieurs employés auraient ignoré délibérément le bouton d’acceptation du popup de consentement, d’autres auraient trouvé des moyens de désactiver le logiciel via les paramètres système. Ce qui n’est pas qu’une posture : des signalements internes font état de ralentissements significatifs sur les machines équipées de MCI, avec des saisies clavier et des mouvements de souris devenus particulièrement lents après l’installation.

L’argument avancé par le porte-parole de Meta reste cohérent d’un point de vue technique : pour entraîner des agents qui doivent reproduire les interactions humaines avec un ordinateur, il faut effectivement des exemples réels de ces interactions. Reste que la frontière entre « entraînement de modèle » et « surveillance de l’activité professionnelle » mérite d’être posée clairement dans les politiques RH.

xAI et la déclaration de revenus à 420 dollars : l’épisode embarrassant

La palme de l’originalité (très discutable mais là encore, sans surprise) revient peut-être à xAI, la société d’Elon Musk derrière le modèle Grok. Des managers auraient proposé à des employés 420 dollars en échange de leurs déclarations fiscales personnelles, celles de leurs amis et de leurs proches, pour alimenter l’entraînement du modèle. Deux mois après ces promesses, selon Bloomberg, les paiements n’auraient toujours pas été effectués. Au-delà du caractère savoureux de l’anecdote, on mesure ici à quel point l’appétit en données personnelles structurées (et les déclarations d’impôts constituent des documents d’une richesse informationnelle considérable : revenus, patrimoine, structures familiales, activités professionnelles) peut pousser à des initiatives pour le moins surprenantes.

Une tendance qui pose question

Cette tendance soulève plusieurs questions concrètes pour les organisations qui déploient des outils d’IA générative :

Premièrement, la question du consentement éclairé des employés. Si un grand éditeur peut légalement collecter des données d’usage via ses outils internes, cela ne signifie pas que la communication vers les salariés est sans importance. La résistance observée chez Meta montre que l’absence de transparence génère de la méfiance, et in fine de la non-conformité.

Deuxièmement, et c’est peut-être la question la plus stratégique pour vos propres organisations : que se passe-t-il avec les données générées par vos développeurs lorsqu’ils utilisent GitHub Copilot, Cursor ou Claude Code ? Les conditions contractuelles de ces outils méritent une lecture attentive. Microsoft a été relativement transparent sur son utilisation des données d’usage Copilot à des fins d’amélioration du service. D’autres éditeurs le sont moins.

Troisièmement, cette dynamique illustre que l’avantage concurrentiel dans l’IA se déplace progressivement vers la possession de données différenciantes. Le web public est largement épuisé comme source d’entraînement inédite. Les données propriétaires, qu’elles viennent du code interne, des interactions utilisateurs ou des comportements d’usage, deviennent le nouvel or noir. Les organisations qui comprennent cela aujourd’hui et construisent une stratégie de données d’entraînement cohérente avec leurs actifs propres seront dans une position favorable demain.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.