Archives de Catégorie: IA

IA : Nvidia propose une application impressionnante de la technologie NeRF

Bluffant : Nvidia vient de produire une nouvelle technologie pour entrainer des algorithmes d’IA dont l’objectif des de créer une scène 3D à partir d’un petit échantillon de photos prises (en 2D donc) sous différents angles. Cette méthode fusionne l’entraînement des réseaux neuronaux et le rendu rapide, et est l’une des premieres de ce type à le faire.

La société a appliqué cette approche à une technologie relativement récente connue sous le nom de champs de radiance neuronaux (NeRF) et a produit « la technique NeRF la plus rapide à ce jour« , Instant NeRF, qui est capable d’atteindre des vitesses de plus de 1 000 fois dans certains cas. Ce modèle a besoin de quelques secondes pour s’entraîner sur quelques dizaines de photos couplées à des métadonnées sur les angles de la caméra, et peut ensuite rendre la scène 3D résultante en « quelques dizaines de millisecondes ».

La création d’une scène 3D avec les méthodes traditionnelles prend des heures ou plus, selon la complexité et la résolution de la visualisation. L’introduction de l’IA accélère les choses. Les premiers modèles NeRF rendaient des scènes nettes et sans artefacts en quelques minutes, mais il fallait encore des heures pour l’entraîner. Ici Instant NeRF, a réduit le temps de rendu de plusieurs ordres de grandeur. Il s’appuie sur une technique développée par NVIDIA, appelée encodage de grille de hachage multi-résolution. Grâce à une nouvelle méthode de codage d’entrée, les chercheurs peuvent obtenir des résultats de haute qualité en utilisant un minuscule réseau neuronal qui tourne rapidement.

Petite illustration vidéo des capacités offertes :

« Si les représentations 3D traditionnelles telles que les maillages polygonaux s’apparentent à des images vectorielles, les NeRF sont comme des images bitmap : elles capturent de manière dense la façon dont la lumière rayonne d’un objet ou d’une scène. En ce sens, l’Instant NeRF pourrait être aussi important pour la 3D que les appareils photo numériques et la compression JPEG l’ont été pour la photographie en 2D, en augmentant considérablement la vitesse, la facilité et la portée de la capture et du partage en 3D. »

David Luebke, vice-président graphics research chez NVIDIA

Les applications de cette technologie sont nombreuses, on pense bien sûr à la création d’avatars réalistes pour le metavers, sans avoir besoin de matériel couteux…

Microsoft Edge : de l’IA au service de l’accessibilité

Microsoft vient d’annoncer en fin de semaine dernière que son navigateur Edge génèrera désormais automatiquement des légendes d’images afin que les lecteurs d’écran puissent décrire le contenu visuel comme c’est le cas actuellement dans Office 365 dès lors que vous ajoutez des illustrations à votre document Word ou votre présentation Powerpoint. Les légendes d’images ou « texte alt » sont un élément crucial du web accessible qui est souvent ignoré, et Microsoft veut remédier à ce problème en fournissant des légendes générées automatiquement mais cette fois lors de la visualisation de la page au cas où les textes alternatifs n’étaient pas indiqué par le développeur de la page Web (ce qui est très souvent le cas… y compris sur le site Calipia et le blog…)

Pour cela, comme c’est le cas pour Office 365; Microsoft utilise les Azure Cognitive Services pour analyser et décrire les images dont le « texte alternatif » est manquant. Lorsque Edge détecte une image non étiquetée, il l’envoie aux serveurs de Microsoft pour traitement. Les algorithmes d’apprentissage automatique peuvent travailler avec les formats les plus courants, tels que JPEG, PNG, GIF, WEBP, et autres, pour fournir des résumés descriptifs en 5 langues. En outre, Microsoft peut analyser le texte des images dans plus de 120 langues. L’éditeur précise qu’il ne générera pas de descriptions pour les images décoratives, les images de moins de 50 x 50 pixels, les images géantes et qu’il se réserve le droit de ne rien générer du tout pour des images dont le contenu est trop … suggestif (comprendre pornographique par exemple mais aussi trop violent).

Sans surprise, les légendes générées automatiquement ne sont pas parfaites, et Microsoft prévient que la qualité est variable en fonction de la simplicité du contenu. Mais c’est mieux que rien !

Si vous souhaitez essayer les légendes générées automatiquement dans Microsoft Edge, mettez à jour votre navigateur avec la dernière version et accédez à Paramètres > Accessibilité, puis activez la fonction « Décrire les images à partir de Microsoft pour les lecteurs d’écran« . Pour l’instant, elle est disponible dans Microsoft Edge pour Windows, Linux et macOS.

Un avant-goût de Mesh for Teams ?

Il y a 1 an, au début 2021, Microsoft levait le voile sur sa nouvelle plateforme de réalité mixte : Microsoft Mesh. Plateforme ayant pour objectif de permettre à des personnes éloignées physiquement de se retrouver dans des expériences holographiques collaboratives et plus immersives.

En novembre dernier, nous vous en parlions au dernier Briefing Calipia, Microsoft a annoncé que Mesh sera intégré à Teams pour des réunions, conversations, appels et la collaboration. Et ceci selon l’éditeur dès le premier semestre 2022, en version beta. Cette implémentation ne devrait pas nécessiter obligatoirement d’équipement particulier, comme un casque de réalité virtuelle ou mixte type Hololens de l’éditeur pour fonctionner. Mais être actif à partir de votre seule webcam, ainsi que Microsoft en faisait des démonstrations. On serait alors dans ce mode avec de simple avatars animés.

Le flux audio sera utilisé pour animer le visage. Vous évitant même de démarrer votre vidéo pour disposer d’un avatar. Ultérieurement, c’est à renfort de technologies d’IA que les expressions faciales et mouvements seront affinés.

Mesh pour Teams sera ainsi accessible depuis des smartphones et ordinateurs portables classiques. Sans surprise, pour aller plus loin dans l’expérience immersive en 3D sans surprise un casque sera requis. Sans que l’éditeur ne présente explicitement sa solution matérielle après les incertitudes actuelles sur l’avenir d’Hololens.

Mais si vous êtes impatient, et vous désirez tester l’usage de ce type de chose avant leur mise à disposition par Microsoft, il existe des solutions. En particulier l’utilisation de Snap Camera qui intercepte le flux vidéo de votre webcam pour vous transformer en avatar et présenter se dernier dans votre application de visio.

Nous vous expliquons tout ceci sur cette petite vidéo, issue de notre toute nouvelle chaine Youtube.

Finalisation du rachat de Nuance Communications par Microsoft

11 mois après avoir annoncé le rachat de Nuance, Microsoft vient donc de confirmer la finalisation de l’opération. Le rachat d’un montant de 19,7 milliards de dollars renforce les positions de Microsoft dans le domaine du traitement du langage naturel, et donc des solutions IA sous-jacentes. Nuance Communication est un acteur historique sur ce domaine. L’entreprise créée en 1992 et basée à Burlington dans le Massachusetts est présent dans de nombreux secteurs verticaux et en particulier dans celui de la santé. Microsoft et Nuance avaient annoncé un accord de collaboration en 2019 autour de l’utilisation des solutions de Nuance sur la plateforme Microsoft Cloud for Healthcare.

La CEO de Nuance, Mark Benjamin, reste à la tête de Nuance et il est rattaché à Scott Guthrie, Microsoft Cloud + AI group Executive Vice President.

Microsoft investit pour la Singularité

source : onmsft.com

Selon Mary Jo Foley, observatrice affutée de Microsoft, les équipes Azure et Microsoft Research ont mis sur pied une nouvelle infrastructure, Singularity, qui serait selon les mots d’un document technique signé par plusieurs membres de l’équipe « Le service d’ordonnancement mondialement distribué de Microsoft pour une exécution hautement efficace et fiable des charges de travail d’apprentissage profond et d’inférence« . L’objectif poursuivi avec Singularity est de disposer d’une infrastructure dédiée au traitement de workloads IA (Deep Learning) de manière dynamique, distribuée au niveau mondial, efficace et sans compromis sur la qualité des résultats.

Le traitement de charges Deep Learning, pour les phases d’apprentissage en particulier, nécessite de disposer de ressources lourdes et couteuses. L’explosion des usages tirant partie de ces techno Deep Learning, et les perspectives de Metavers mettent la pression sur la nécessité de disposer de ressources de travail distribuées, hautement scalables, aussi bien pour les développements internes des acteurs de plateforme comme Microsoft, que pour leurs clients potentiels en mode As a Service.

Le nom choisi par Microsoft n’est pas le résultat du hasard, puisque le terme Singularité associé à l’IA décrit précisément le moment où les algorithmes d’IA dépasseront les capacités de l’intelligence humaine. L’infra Singularity serait donc pour Microsoft un outil pour atteindre cette cible. Si ce point de Singularité pour l’IA est pour le moment lointain, voire hypothétique, il n’en reste pas moins un chiffon rouge pour de nombreux détracteurs des techno IA, qui considèrent que la course à la puissance pour atteindre cet objectif devrait être subordonnée aux travaux sur une IA éthique et digne de confiance. Sur cette thématique, un article intéressant publié par Microsoft Research et qui fait le point sur ces questions d’IA Responsable.

100 milliards de photos de visages pour reconnaitre tous les humains

L’entreprise américaine Clearview AI affirme dans une note aux investisseurs être capable de reconnaitre les 7,5 milliards d’humains sur terre avec 100 milliards de photos seulement, soit 14 par personne. Selon un article du Washington Post qui se serait procuré une copie des informations remises par l’entreprise à des investisseurs potentiels, Clearview AI dispose aujourd’hui d’une base photographiques de référence contenant 10 milliards d’images, et que sa capacité de capture mensuelle était de 1,5 milliard. Et qu’avec un nouvel investissement de 50 millions de dollars, ClearView pourrait atteindre rapidement les 100 milliards d’images pour reconnaitre quasiment tous les humains sur terre !

Clearview AI s’est fait connaitre ces dernières années de manière plutôt négative, à cause d’une part de sa spécialisation sur les solutions de reconnaissance faciale, et d’autre part à cause des ses pratiques de collectes de photos de visages sur tous les sites possibles, sans jamais demander les autorisations ni de collecte, ni d’exploitation. Depuis le meurtre de George Floyd, et le vaste mouvement de protestation associé, la reconnaissance faciale et les solutions proposées commercialement par les AWS, Microsoft, Google, IBM … ont été mise en cause. Parmi ces acteurs, certains ont annoncé arrêter tout développement dans ce domaine et d’autres simplement les mettre en veille dans l’attente d’une réglementation aux USA (voir ici et ).

Si la réglementation aux US attend toujours de voir le jour, ClearView AI est pointé du doigt pour ses solutions et ses pratiques, aussi bien par d’autres acteurs HighTech (Facebook, Google, Twitter ..) que par des associations de défense des droits telles que l’ACLU (American Civil Liberties Union), et de nombreuses actions en justice sont engagées. Dans le reste du monde également, la position de ClearView est difficile, ainsi fin décembre 2021 en France la CNIL a mis en demeure l’entreprise de cesser de collecter et d’utiliser des photos sur Internet.

Ce nouvel épisode ne va certainement pas contribuer à calmer les inquiétudes légitimes concernant la reconnaissance faciale et un des ses champions….

#CES 2022 : bras robot modulaire

De nombreux bras robots étaient présents au CES, y compris des mains robotisée. En marge du CES, nous avons flashé sur le projet KickStarter de bras robot HUENIT.

Ce projet est très original car d’une part il est modulaire. Il est conçu pour utiliser l’IA, la 3D, le laser et la robotique facilement et rapidement. Il suffit pour cela d’insérer la bonne tête pour que ce bars se transforme en imprimante 3D, en Laser ou encore en porte cuillère 🙂 Mais aussi il est très accessible : moins de 1000 €

Une petite vidéo du constructeur qui explique tout cela :

Et le pointeur sur le projet

#CES 2022 : Qualcomm veut s’imposer dans l’automobile

À l’occasion du CES 2022, Qualcomm a annoncé plusieurs nouvelles extensions de ses partenariats avec de grands constructeurs automobiles afin de fournir des plates-formes matérielles et logicielles pour les véhicules connectés, en s’associant à Volvo, Honda et Renault pour ajouter davantage de fonctionnalités à leurs prochaines voitures.

Qualcomm dispose déjà d’une suite complète de plateformes automobiles, qu’elle appelle le Qualcomm Digital Chassis. L’objectif est de fournir aux constructeurs automobiles une variété d’outils qu’ils peuvent utiliser pour rendre leurs voitures plus intelligentes et plus connectées.

Ces outils comprennent :

  • Snapdragon Ride, qui fournit des technologies d’assistance au conducteur et de conduite automatisée.
  • Snapdragon Cockpit, pour les expériences embarquées, y compris les SoC et les solutions logicielles pour l’alimentation d’écrans multiples et de systèmes audio/vidéo/multimédia.
  • Snapdragon Auto Connectivity, qui fournit aux constructeurs automobiles des solutions LTE, 5G, Wi-Fi et GPS pour connecter les voitures à Internet, au cloud et à d’autres véhicules.
  • Snapdragon Car-to-Cloud Services, qui fournit des fonctions de sécurité et une plateforme pour ajouter des mises à jour over-the-air et des services payants, intégrant le backoffice d’analyse des véhicules et des utilisateurs.

Pour rappel c’est sur ce point que Microsoft avec Azure est très présent, en concurrence donc avec Qualcomm. Microsoft ayant fait le choix de s’associer avec les équipementiers automobile, eux aussi en pleine transformation digitale, la part du logiciel deviendra prépondérente dans leurs offres dans les années à venir.

Honda, par exemple, a annoncé lors du CES 2022 qu’il utiliserait la plate-forme Snapdragon Cockpit de troisième génération de Qualcomm pour alimenter son système d’infodivertissement basé sur Android dans les prochaines voitures qui seront commercialisées aux États-Unis au second semestre 2022 et au début 2023. Volvo a annoncé un plan similaire lors de la conférence, en collaborant avec Qualcomm et Google pour proposer des systèmes d’infodivertissement Android dans son prochain SUV Polestar 3 et dans le SUV entièrement électrique prévu par Volvo.

Renault, quant à lui, prévoit d’adopter le Digital Chassis de Qualcomm de manière plus complète, en utilisant les plates-formes Qualcomm pour la connectivité, l’assistance au conducteur, les expériences dans le cockpit et les services en nuage sur les prochains véhicules Renault. Sans préciser comment celà s’articule avec les partenariats en place avec Microsoft dans ce même domaine…

Ces nouveaux accords s’ajoutent à ceux que Qualcomm avait déjà conclus avec d’autres grands constructeurs automobiles, notamment BMW, General Motors et Hyundai.

Nouvelles fonctions pour Azure Space

Azure Space – cloud-powered innovation on and off the planet - The Official  Microsoft Blog

Microsoft a annoncé de nouvelles capacités mais aussi de nouveaux partenariats pour Azure Space, la plate-forme de la société qui relie les satellites et les services. L’entreprise a également dévoilé des outils pour améliorer les images satellite.

Premier service : Azure Orbital permettant de communiquer et de contrôler les satellites depuis des stations au sol. Les entreprises peuvent ainsi stocker, traiter et analyser des données issues des équipements dans le cloud.

Microsoft a également dévoilé SpaceEye, un outil alimenté par l’IA qui va chercher des images satellites optiques et multispectrales de la Terre sans nuages :

« SpaceEye utilise l’instrument radar à synthèse d’ouverture (SAR) de la mission Sentinel-1 comme source de données de base, car les données radar ne sont pas affectées par la couverture nuageuse. SpaceEye combine ensuite ces données radar avec l’imagerie optique historique pour générer une prédiction d’image IA de ce à quoi cela ressemble sous les nuages. Cela peut débloquer des cas d’utilisation importants dans l’agriculture, la surveillance de l’utilisation des terres et la réponse aux catastrophes, entre autres« ,

Tom Keane, CVP pour Microsoft Azure.

Il y a quelques temps Microsoft annonçait aussi le Turing, (IA sur Microsoft Azure) qui sera aussi utilisé ici pour amélioré la résolution des images satellite.

Enfin, Microsoft a également annoncé de nouveaux partenariats avec Airbus, Blackshark.ai, iDirect, Esri, ainsi qu’Orbital Insight pour fournir de nouvelles images satellites haute résolution.

Gartner : Le marché des logiciels d’IA atteindra 62 Milliards de $ en 2022

Selon Gartner le Chiffre d’affaire des logiciels d’IA devrait atteindre 62,5 milliards de dollars en 2022. En croissance de plus de 20% sur 2021 donc. Le cabinet détaille chacune des principales catégories du domaine :

  • la gestion des connaissances, l
  • les assistants virtuels,
  • les véhicules autonomes,
  • le lieu de travail numérique,
  • les données issues des foules et autres.

Parmi ces catégories , la gestion des connaissances devrait connaître la plus forte croissance à 31,5 %, en revanche les assistants virtuels qui avaient connus une très forte croissance en 2019 devraient cette fois croissent plus faiblement à à 14,7 %. Nous sommes en tout cas encore bien loin d’un marché mature ! Y compris dans ce dernier secteur.

Un des freins les plus important étant, sans surprise, l’éthique de ces solutions. Nous l’avons vu encore récemment avec la pression des employés de Google pour freiner les ventes sur des secteurs comme l’armée, ou encore dans certains pays. Mais aussi les expérimentations liées à la reconnaissance faciale qui sont très limitées dans les démocraties, un peu moins dans les dictatures…

Selon Gartner, les dépenses des entreprises en matière d’IA continueront d’augmenter à mesure que les organisations surmonteront leur réticence à adopter l’IA et à lui faire confiance, et qu’elles trouveront des moyens de tirer une valeur commerciale des technologies d’IA.

« Entrées précédentes