Què és Data Catalog AWS?
Què és Data Catalog AWS?

Vídeo: Què és Data Catalog AWS?

Vídeo: Què és Data Catalog AWS?
Vídeo: Getting Started with AWS Glue Data Catalog 2024, Maig
Anonim

El AWS Cola Catàleg de dades és un dipòsit central per emmagatzemar metadades estructurals i operatives per a tots els vostres dades actius. Per un donat dades configurat, podeu emmagatzemar la definició de la taula, la ubicació física, afegir atributs rellevants per a l'empresa, així com fer un seguiment de com això dades ha canviat amb el temps.

Tenint en compte això, què és el catàleg de dades de cola d'AWS?

El Catàleg de dades d'AWS Glue conté referències a dades que s'utilitza com a fonts i objectius de les vostres feines d'extracció, transformació i càrrega (ETL). AWS Glue . Normalment, feu servir un rastrejador per fer l'inventari dades en el teu dades botigues, però hi ha altres maneres d'afegir taules de metadades al vostre Catàleg de dades.

Al costat de dalt, es pot configurar amb cola AWS? AWS Glue no té servidor, de manera que no hi ha infraestructura conjunt aixecar o gestionar. Vostè llauna també utilitzeu el AWS Glue Operacions de l'API amb les quals interaccionar AWS Glue serveis. Editeu, depureu i proveu el vostre codi ETL de Python o Scala Apache Spark mitjançant un entorn de desenvolupament conegut.

També cal saber què és un catàleg de dades?

A catàleg de dades és una eina de gestió de metadades dissenyada per ajudar les organitzacions a trobar i gestionar grans quantitats de dades –incloses taules, fitxers i bases de dades– emmagatzemats al seu ERP, recursos humans, finances i sistemes de comerç electrònic, així com altres fonts com fonts de xarxes socials.

Per a què serveix la cola AWS?

AWS Glue és un servei d'extracció, transformació i càrrega (ETL) totalment gestionat que facilita als clients preparar i carregar les seves dades per analítiques. Podeu crear i executar una tasca ETL amb uns quants clics a la pàgina AWS Consola de gestió.

Recomanat: