Archives de Catégorie: Big Data

Après les Chief Happiness Officer, voici les Data Dignity teams

A l’heure du Big Data et de la collecte des données personnelles à tout va, MICROSOFT met en avant sa stratégie de protection des données personnelles, élément différentiant par rapport aux Google ou Facebook. Certes, Microsoft s’est retrouvé aussi exposé sur certains sujets relatifs aux données personnelles (télémétrie Windows 10 ou plus récemment l’utilisation d’humains pour les traductions des conversations Skype), malgré tout Redmond observe sur ces sujets une approche radicalement différente des 2 acteurs mentionnés plus haut.

Dans ce contexte, un certain nombre d’informations ont été recoupés par des analystes vigilants aux USA, qui semblent indiquer que Microsoft met sur pied une équipe rattachée à Kevin Scott, CTO de Microsoft, et dont la job description mentionne la notion de Data Dignity. Derrière cette expression Microsoft recherche les moyens de donner aux utilisateurs le contrôle complet de leurs données personnelles (allant même jusqu’à permettre aux utilisateurs de vendre leurs informations personnelles). Cette quête prend de plus en plus de sens dans du monde où les technologies d’IA telles que le Deep Learning et le Machine Learning permettent d’induire des infos très riches et très personnelles … à partir de la masse d’informations existantes de tous ordres concernant ces utilisateurs issus des réseaux sociaux (pro ou perso), des applis qui nous géolocalisent, des photos ou vidéos partagés, …. Aujourd’hui sur le web on trouve donc pour un utilisateur des données brutes (celles fournies explicitement par l’utilisateur, par ex celles fournies lors de l’inscription au service), mais aussi des données induites par les différentes IA à l’œuvre. Rendre le contrôle aux utilisateurs de toutes ces données personnelles (brutes ou induites) est donc un moyen de contribuer à la dignité de ces utilisateurs (d’où le terme data dignity mentionné).

Cette notion de Data Dignity devrait dépasser le cadre d’une communication pour le moment réservé à quelque acteurs bien informés pour prendre une place de choix dans la communication de Microsoft dans les mois à venir.

Une préversion pour SQL Server 2019

SQL Server LogoSQL Server, le moteur de base de données historique de Microsoft existe depuis 1989, et même si la stratégie de l’éditeur s’oriente clairement sur le Cloud et les services de données et d’analyse proposés sur sa plateforme Azure, il reste un certain nombre d’entreprises qui gèrent elles-mêmes leurs données, dans leurs propres datacenters.

Donc l’offre « on premise » de gestion et analyse de données de Microsoft continue à évoluer, avec la première version de test de SQL 2019.

SQL Server 2019 peut être utilisé pour divers projets de données allant du traitement transactionnel en ligne (OLTP) au Data Warehousing en passant par la Business Intelligence (BI), sans oublier une application à l’IA ainsi qu’à l’analyse avancée.

Grâce à une refonte complète du moteur de stockage de la base de données phare et de sa technologie PolyBase, SQL Server cherche à devenir une véritable plateforme Big Data, notamment par l’intégration de HDFS (Hadoop Distributed Filing System) et Apache Spark. SQL Server pourra désormais utiliser HDFS pour le stockage et va exploiter éventuellement Spark pour l’ingénierie des données et les tâches d’apprentissage automatique. Il faut noter qu’il pourra lui-même fonctionner avec une architecture distribuée.

SQL Server 2019

L’intégration de Spark et du système de fichiers distribués Hadoop (HDFS) va permettre aux utilisateurs d’intégrer, de stocker et d’analyser de grandes quantités de données. Microsoft a également inclus de nouveaux connecteurs permettant d’interroger d’autres bases de données telles que Oracle, Teradata et MongoDB directement à partir de SQL Server.

SQL Server va continuer également de fonctionner dans son architecture SMP conventionnelle et les améliorations apportées à PolyBase sont elles aussi disponibles. Ces améliorations incluent la possibilité de se connecter à Oracle, Teradata, MongoDB, aux sources de données ODBC génériques et même à d’autres instances SQL Server, en plus du support continu du stockage Azure et des clusters Hadoop Cloudera et Hortonworks.

Enfin SQL Server 2019 apporte des fonctionnalités améliorées aux fonctionnalités de traitement de graphes introduites dans SQL Server 2017. Il ajoute également la prise en charge de l’exécution in-place du code Java, en utilisant la même infrastructure qui permet au code R et Python de s’exécuter dans la base de données et faciliter le composant Machine Learning Services du produit, qui s’exécutera désormais sur des instances SQL Server Linux ainsi que sur celles exécutées sous Windows.

Derniers articles »