USA : une nouvelle « agence » gouvernementale chargée de la recherche sur l’IA

La Maison Blanche a annoncé cette semaine la publication d’un rapport final (téléchargement PDF) décrivant un plan triennal pour la création d’une agence nationale de recherche en intelligence artificielle (NAIRR). Objectif selon le plan, même si ce n’est pas dit aussi clairement : proposer une alternative publique à la recherche sur l’IA qui est largement dans les mains des géants du numérique, Meta, Microsoft, Google et Apple en tête…
Le rapport cite quelques chiffres pour appuyer son raisonnement :
« Même si les investissements privés dans l’IA ont plus que doublé entre 2020 et 2021 pour atteindre environ 93,5 milliards de dollars, le nombre de nouvelles entreprises a diminué. La disparité dans la disponibilité des ressources de recherche en IA affecte la qualité et le caractère de l’écosystème américain d’innovation en IA, contribuant à une « fuite des cerveaux » des meilleurs talents de l’IA des institutions universitaires et de recherche vers un petit ensemble d’entreprises bien dotées en ressources« .
Le NAIRR est envisagé comme une infrastructure partagée de recherche sur l’IA à usage public, dont le coût s’élève à 2,6 milliards de dollars sur six ans. Le plan prévoit une approche en quatre phases sur trois ans pour créer une infrastructure d’IA « démocratisée » que les étudiants et les chercheurs pourront exploiter. Elle donnera accès à des ressources de données gouvernementales et non gouvernementales.
Alors certes, les champions locaux du numérique sont visés, mais sans surprise, c’est bien la Chine et ses investissements dans ce secteur qui sont dans le collimateur du gouvernement Biden :
« Les pays qui ont investi à long terme dans la recherche sur l’IA, comme la Chine, enregistrent des avancées technologiques. La Chine compte plus de citations de publications sur l’IA et plus de demandes de brevets sur l’IA que les États-Unis.«
La première phase de la mise en oeuvre du NAIRR consiste à autoriser les fonds pour son infrastructure. La deuxième phase (année 1) implique de travailler avec une « entité opérationnelle », qui peut travailler avec des « fournisseurs de ressources ». Les premières opérations du NAIRR devraient commencer au cours de la troisième phase (année 2). Enfin, la pleine capacité du NAIRR pour un fonctionnement en régime permanent devrait intervenir au cours de la quatrième étape (année 3).
Le rapport propose également des estimations de coûts pour la construction de « grands modèles d’apprentissage profond à forte intensité de calcul », tels que ceux mis en œuvre par OpenAI avec GPT-3 (175 milliards de paramètres) et Google (1600 milliards de paramètres).
Mais tout ceci devra se faire avec les grands fournisseurs privés, pas question de tout développer. Le rapport envisage que des entités privées soient en concurrence pour devenir des fournisseurs de ressources. Elles pourraient recevoir un « financement » en échange de la mise à disposition de leurs ressources, ou elles pourraient faire un échange pour avoir accès aux ressources du NAIRR.
Le NAIRR pourrait également tirer parti des ressources de données fédérales qui sont déjà stockées dans clouds d’Amazon et Microsoft . Le rapport indique que « plus de 36 pétaoctets de données de séquençage génomique à accès public et contrôlé hébergées par la National Library of Medicine des NIH » sont stockés sur deux plates-formes commerciales . De même, « 42 et 10 pétaoctets de données météorologiques et environnementales publiques » collectées par la National Oceanic and Atmospheric Administration sont disponibles sur trois plateformes en nuage commerciales.