En cliquant sur "Accepter", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser l'utilisation du site et de nous aider dans nos efforts de marketing.

Amazon SageMaker Data Wrangler

Amazon SageMaker Data Wrangler
Blog
>
Amazon SageMaker Data Wrangler
Discoverii
6/4/2023

Amazon Web Services (AWS) est le plus grand fournisseur de services de cloud computing au monde, proposant une large gamme de services de calcul, de stockage, de base de données, d'analyse et de sécurité. L'un des services les plus récents proposés par AWS est Amazon SageMaker Data Wrangler, un outil conçu pour aider les développeurs d'intelligence artificielle et d'apprentissage automatique à préparer rapidement des données pour la formation de modèles.

Amazon SageMaker Data Wrangler permet aux utilisateurs de nettoyer, d'agréger et de préparer les données nécessaires pour la formation de modèles, le tout à l'aide d'une interface visuelle conviviale. Cette solution réduit considérablement le temps nécessaire pour préparer les données pour l'apprentissage automatique, passant de plusieurs semaines à seulement quelques minutes. Avec Amazon SageMaker Data Wrangler, les développeurs peuvent facilement explorer, nettoyer et préparer les données, qu'elles soient stockées sur Amazon S3, Amazon Athena, Amazon Redshift, Amazon EMR ou plus de 40 applications SaaS prises en charge.

AWS annonce aujourd'hui que Amazon SageMaker Data Wrangler prend désormais en charge l'authentification basée sur OAuth avec des fournisseurs d'identité tels que Okta, Microsoft Azure AD et Ping Federate pour accéder aux données de Snowflake pour l'apprentissage automatique. Cette nouvelle fonctionnalité permet aux clients qui souhaitent utiliser un seul fournisseur d'identité pour gérer leurs utilisateurs, leurs groupes et le contrôle d'accès de toutes les applications, y compris Snowflake.

Avec cette nouvelle fonctionnalité, les administrateurs peuvent configurer l'accès OAuth de Snowflake pour Data Wrangler. Les utilisateurs peuvent ensuite se connecter à Data Wrangler à l'aide de leur fournisseur d'identité d'organisation lorsqu'ils se connectent à Snowflake pour importer des données pour l'apprentissage automatique. Cette fonctionnalité offre une solution simple et efficace pour les entreprises qui ont besoin d'accéder à des données dans Snowflake tout en gérant l'accès de manière centralisée à l'aide de leur fournisseur d'identité préféré.

Cette nouvelle fonctionnalité est disponible sans frais supplémentaires pour les utilisateurs d'Amazon SageMaker Data Wrangler. Cette solution prend en charge Okta, Microsoft Azure AD et Ping Federate pour les connexions Snowflake dans toutes les régions actuellement prises en charge par Data Wrangler.

Amazon SageMaker Data Wrangler offre également un certain nombre d'autres fonctionnalités intéressantes pour les développeurs d'IA et d'apprentissage automatique. Par exemple, les utilisateurs peuvent rapidement comprendre la qualité des données, nettoyer les données et créer des fonctionnalités avec plus de 300 analyses intégrées et transformations de données en utilisant l'interface visuelle de Data Wrangler. Les utilisateurs peuvent également former et déployer un modèle avec SageMaker Autopilot et opérationnaliser le processus de préparation des données dans l'ingénierie de fonctionnalités, la formation ou le pipeline en utilisant l'intégration avec SageMaker Pipeline, le tout depuis Data Wrangler.

Amazon SageMaker Data Wrangler est une solution efficace pour les entreprises qui souhaitent accélérer leur processus de préparation de données pour l'apprentissage automatique. Grâce à cette solution, les développeurs peuvent explorer les données plus rapidement, obtenir des résultats plus précis et plus fiables, et déployer des modèles plus rapidement. Cette solution est particulièrement utile pour les entreprises qui traitent de grandes quantités de données ou qui ont besoin d'accéder à des données provenant de diverses sources.

En conclusion, Amazon SageMaker Data Wrangler est une solution puissante pour préparer rapidement les données pour l'apprentissage automatique. Avec l'ajout de l'authentification basée sur OAuth avec des fournisseurs d'identité tels que Okta, Microsoft Azure AD et Ping Federate pour accéder aux données de Snowflake, cette solution est désormais encore plus flexible et facile à utiliser. Les entreprises qui cherchent à accélérer leur processus de préparation de données pour l'apprentissage automatique devraient envisager d'utiliser Amazon SageMaker Data Wrangler.