Ce este Data Catalog AWS?
Ce este Data Catalog AWS?

Video: Ce este Data Catalog AWS?

Video: Ce este Data Catalog AWS?
Video: Getting Started with AWS Glue Data Catalog 2024, Aprilie
Anonim

The AWS Lipici Catalog de date este un depozit central pentru a stoca metadate structurale și operaționale pentru toate dvs date active. Pentru un dat date set, puteți stoca definiția tabelului, locația fizică, adăugați atribute relevante pentru afaceri, precum și urmăriți cum acest lucru date s-a schimbat de-a lungul timpului.

Având în vedere acest lucru, ce este AWS glue data catalog?

The Catalogul de date AWS Glue conţine referinţe la date care este folosit ca surse și ținte pentru joburile dvs. de extragere, transformare și încărcare (ETL). AWS Glue . De obicei, rulați un crawler pentru a face inventarul date în dumneavoastră date magazine, dar există și alte modalități de a adăuga tabele de metadate în tabelele dvs Catalog de date.

Alături de mai sus, poate fi setat în lipici AWS? AWS Glue este fără server, deci nu există infrastructură a stabilit sus sau gestionați. Tu poate sa utilizați și AWS Glue Operațiuni API cu care se interfață AWS Glue Servicii. Editați, depanați și testați codul ETL Python sau Scala Apache Spark folosind un mediu de dezvoltare familiar.

De asemenea, trebuie să știți ce este un catalog de date?

A catalog de date este un instrument de gestionare a metadatelor conceput pentru a ajuta organizațiile să găsească și să gestioneze cantități mari de date – inclusiv tabele, fișiere și baze de date – stocate în sistemele lor ERP, resurse umane, finanțe și comerț electronic, precum și alte surse, cum ar fi feedurile de rețele sociale.

Pentru ce se folosește lipiciul AWS?

AWS Glue este un serviciu de extragere, transformare și încărcare (ETL) complet gestionat, care facilitează pregătirea și încărcarea datelor pentru clienți pentru analiză. Puteți crea și rula un job ETL cu câteva clicuri în AWS Consola de administrare.

Recomandat: