Tout en utilisant des travaux ETL, les utilisateurs peuvent également construire et surveiller les pipelines de données à travers lesquelles les données extraites sont transférées. AWS Glue s'intègre à des services comme Amazon S3, Amazon DynamoDB, Amazon Redshift et Amazon RDS pour extraire et déplacer des données.
Cet article décrira les aspects suivants de la colle AWS:
Quels sont les composants de la colle Aws?
Voici quelques composants de la colle AWS qui fonctionnent en coordination pour effectuer diverses tâches:
Console AWS Glue: La console AWS Glue définit le flux de travail ETL et appelle les opérations de l'API dans d'autres composants AWS Glue pour effectuer différentes tâches comme l'exécution et la planification des robots, la création de tables, la configuration des connexions, etc.
Catalogue: AWS Glue Data Catalog est la boutique de métadonnées du cloud AWS. Dans chaque compte AWS, chaque région AWS a un catalogue de données de colle déjà créé. Dans les catalogues de données, les tableaux contenant des données de différents services comme AWS RDS sont stockés sous une forme organisée.
Crawlers et classificateurs: Crawlers peut scanner les données de tous les types de référentiels sur AWS. Grâce à Crawlers, les utilisateurs peuvent créer des bases de données pour organiser les tables de données des données extraites dans la colle AWS afin que les données soient propres et organisées.
Opérations ETL: L'utilisateur peut «extraire» les données d'un service et «transformer» les données (par exemple, extraire les données brutes et les transformer en une forme propre en les catégorisant en différents ensembles de données), puis «charger» les données ou faire ces données accessible pour les services qui font la queue et analysent les données.
Emplois ETL: Les travaux AWS Glue ETL gèrent le flux de travail ETL via certaines configurations. Les utilisateurs peuvent planifier des travaux ETL dans le flux de données et déclencher le travail sur des événements spécifiques comme lorsque de nouvelles données sont déplacées, un tableau de données est supprimé, etc.
Quelle est l'importance de la colle aws?
AWS Glue est populaire pour diverses raisons, y compris ce qui suit:
Comment utiliser AWS Glue?
L'utilisation de la colle AWS est très simple. Ouvrez le service «AWS Glue» après s'être connecté à la console AWS. Dans le menu gauche de la console AWS Glue, il y aura une liste d'options qui rendront les fonctionnalités du service AWS Glue plus compréhensible. L'utilisateur peut effectuer n'importe quel travail ETL (extraire, transformation et charge) dans la colle AWS:
Par exemple, nous sélectionnons l'option «Bases de données» pour créer une base de données dans la colle AWS ou accéder à une base de données créée dans tout autre service AWS:
De même, les utilisateurs peuvent créer des chenilles dans AWS:
Si nous ouvrons les détails de l'un des robots créés, il affiche sa source de données. Ici, il est clair que les données sont accessibles à partir d'un seau créé dans le service AWS S3:
Expliquée ci-dessus concernait AWS Glue, ses composants, son importance et son utilisation.
Conclusion
AWS Glue est le service d'intégration de données sans serveur d'AWS qui déplace les données entre les services AWS, les applications et les composants logiciels. Les données sont d'abord extraites puis transférées après modification vers un autre service en utilisant efficacement AWS Cloud Resources. Ce service AWS fiable et évolutif est également facile à utiliser et est préféré aux autres plateformes avec les mêmes fonctionnalités en raison de ses fonctionnalités vastes et utilisables et de sa rentabilité.