Archives de Catégorie: Big Data

Une préversion pour SQL Server 2019

SQL Server LogoSQL Server, le moteur de base de données historique de Microsoft existe depuis 1989, et même si la stratégie de l’éditeur s’oriente clairement sur le Cloud et les services de données et d’analyse proposés sur sa plateforme Azure, il reste un certain nombre d’entreprises qui gèrent elles-mêmes leurs données, dans leurs propres datacenters.

Donc l’offre « on premise » de gestion et analyse de données de Microsoft continue à évoluer, avec la première version de test de SQL 2019.

SQL Server 2019 peut être utilisé pour divers projets de données allant du traitement transactionnel en ligne (OLTP) au Data Warehousing en passant par la Business Intelligence (BI), sans oublier une application à l’IA ainsi qu’à l’analyse avancée.

Grâce à une refonte complète du moteur de stockage de la base de données phare et de sa technologie PolyBase, SQL Server cherche à devenir une véritable plateforme Big Data, notamment par l’intégration de HDFS (Hadoop Distributed Filing System) et Apache Spark. SQL Server pourra désormais utiliser HDFS pour le stockage et va exploiter éventuellement Spark pour l’ingénierie des données et les tâches d’apprentissage automatique. Il faut noter qu’il pourra lui-même fonctionner avec une architecture distribuée.

SQL Server 2019

L’intégration de Spark et du système de fichiers distribués Hadoop (HDFS) va permettre aux utilisateurs d’intégrer, de stocker et d’analyser de grandes quantités de données. Microsoft a également inclus de nouveaux connecteurs permettant d’interroger d’autres bases de données telles que Oracle, Teradata et MongoDB directement à partir de SQL Server.

SQL Server va continuer également de fonctionner dans son architecture SMP conventionnelle et les améliorations apportées à PolyBase sont elles aussi disponibles. Ces améliorations incluent la possibilité de se connecter à Oracle, Teradata, MongoDB, aux sources de données ODBC génériques et même à d’autres instances SQL Server, en plus du support continu du stockage Azure et des clusters Hadoop Cloudera et Hortonworks.

Enfin SQL Server 2019 apporte des fonctionnalités améliorées aux fonctionnalités de traitement de graphes introduites dans SQL Server 2017. Il ajoute également la prise en charge de l’exécution in-place du code Java, en utilisant la même infrastructure qui permet au code R et Python de s’exécuter dans la base de données et faciliter le composant Machine Learning Services du produit, qui s’exécutera désormais sur des instances SQL Server Linux ainsi que sur celles exécutées sous Windows.