Qu'est-ce que la colle aws

Qu'est-ce que la colle aws
AWS Glue est un service de calcul d'intégration de données AWS qui aide à déplacer les ensembles de données entre les services pour les préparer à l'analyse. Les ensembles de données stockés dans les services de stockage Amazon comme S3 sont transférés aux services qui analysent des ensembles de données comme AWS ATHENA. La fonction principale de la colle AWS est de créer des travaux ETL (extraire, transformation et charge). Les emplois ETL extraient les données des bases de données d'un service particulier, puis modifient et déplacez les données vers un autre endroit où elles doivent être analysées.

Tout en utilisant des travaux ETL, les utilisateurs peuvent également construire et surveiller les pipelines de données à travers lesquelles les données extraites sont transférées. AWS Glue s'intègre à des services comme Amazon S3, Amazon DynamoDB, Amazon Redshift et Amazon RDS pour extraire et déplacer des données.

Cet article décrira les aspects suivants de la colle AWS:

  • Quels sont les composants de la colle Aws?
  • Quelle est l'importance de la colle aws?
  • Comment utiliser AWS Glue?

Quels sont les composants de la colle Aws?

Voici quelques composants de la colle AWS qui fonctionnent en coordination pour effectuer diverses tâches:

Console AWS Glue: La console AWS Glue définit le flux de travail ETL et appelle les opérations de l'API dans d'autres composants AWS Glue pour effectuer différentes tâches comme l'exécution et la planification des robots, la création de tables, la configuration des connexions, etc.

Catalogue: AWS Glue Data Catalog est la boutique de métadonnées du cloud AWS. Dans chaque compte AWS, chaque région AWS a un catalogue de données de colle déjà créé. Dans les catalogues de données, les tableaux contenant des données de différents services comme AWS RDS sont stockés sous une forme organisée.

Crawlers et classificateurs: Crawlers peut scanner les données de tous les types de référentiels sur AWS. Grâce à Crawlers, les utilisateurs peuvent créer des bases de données pour organiser les tables de données des données extraites dans la colle AWS afin que les données soient propres et organisées.

Opérations ETL: L'utilisateur peut «extraire» les données d'un service et «transformer» les données (par exemple, extraire les données brutes et les transformer en une forme propre en les catégorisant en différents ensembles de données), puis «charger» les données ou faire ces données accessible pour les services qui font la queue et analysent les données.

Emplois ETL: Les travaux AWS Glue ETL gèrent le flux de travail ETL via certaines configurations. Les utilisateurs peuvent planifier des travaux ETL dans le flux de données et déclencher le travail sur des événements spécifiques comme lorsque de nouvelles données sont déplacées, un tableau de données est supprimé, etc.

Quelle est l'importance de la colle aws?

AWS Glue est populaire pour diverses raisons, y compris ce qui suit:

  • AWS Glue est facile à utiliser et rentable par rapport à d'autres plateformes offrant la même fonctionnalité.
  • Les utilisateurs peuvent se connecter à plus de soixante-dix sources de données différentes en utilisant AWS Glue.
  • Il fournit un catalogue de données centralisé pour gérer le processus ETL pour extraire, gérer et passer aux lacs de données.
  • AWS Glue est un service sans serveur, il n'est donc pas nécessaire de configurer, gérer et maintenir les serveurs.

Comment utiliser AWS Glue?

L'utilisation de la colle AWS est très simple. Ouvrez le service «AWS Glue» après s'être connecté à la console AWS. Dans le menu gauche de la console AWS Glue, il y aura une liste d'options qui rendront les fonctionnalités du service AWS Glue plus compréhensible. L'utilisateur peut effectuer n'importe quel travail ETL (extraire, transformation et charge) dans la colle AWS:

Par exemple, nous sélectionnons l'option «Bases de données» pour créer une base de données dans la colle AWS ou accéder à une base de données créée dans tout autre service AWS:

De même, les utilisateurs peuvent créer des chenilles dans AWS:

Si nous ouvrons les détails de l'un des robots créés, il affiche sa source de données. Ici, il est clair que les données sont accessibles à partir d'un seau créé dans le service AWS S3:

Expliquée ci-dessus concernait AWS Glue, ses composants, son importance et son utilisation.

Conclusion

AWS Glue est le service d'intégration de données sans serveur d'AWS qui déplace les données entre les services AWS, les applications et les composants logiciels. Les données sont d'abord extraites puis transférées après modification vers un autre service en utilisant efficacement AWS Cloud Resources. Ce service AWS fiable et évolutif est également facile à utiliser et est préféré aux autres plateformes avec les mêmes fonctionnalités en raison de ses fonctionnalités vastes et utilisables et de sa rentabilité.