Ce este un lac de date în Hadoop?
Ce este un lac de date în Hadoop?

Video: Ce este un lac de date în Hadoop?

Video: Ce este un lac de date în Hadoop?
Video: What is Data Lake | Understand the Data Lake Architecture | Data Lake using Apache Spark 2024, Noiembrie
Anonim

A Lacul de date Hadoop este o date platformă de management care cuprinde unul sau mai multe Hadoop clustere. Este folosit în principal pentru procesarea și stocarea non-relaționale date , cum ar fi fișiere jurnal, înregistrări de flux de clic pe internet, senzor date , obiecte JSON, imagini și postări pe rețelele sociale.

În acest sens, care este diferența dintre un depozit de date și un lac de date?

Lacuri de date și date depozitele sunt ambele utilizate pe scară largă pentru depozitarea mari date , dar nu sunt termeni interschimbabili. A lacul de date este un bazin vast de materie primă date , scopul pentru care nu este încă definit. A depozit de date este un depozit pentru structurat, filtrat date care a fost deja prelucrată într-un anumit scop.

În plus, ce este o arhitectură de lac de date? A Data Lake este un depozit de stocare care poate stoca o cantitate mare de fișiere structurate, semi-structurate și nestructurate date . Spre deosebire de o casă ierarhică Dataware unde date este stocat în Fișiere și Folder, Data Lake are un apartament arhitectură.

În ceea ce privește acest lucru, ce se înțelege prin data lake?

A lacul de date este un depozit de stocare care deține o cantitate mare de raw date în formatul său nativ până când este nevoie. În timp ce un ierarhic date magazine de depozit date în fișiere sau foldere, a lacul de date folosește o arhitectură plată pentru a stoca date . Termenul lacul de date este adesea asociat cu stocarea obiectelor orientată spre Hadoop.

Elasticsearch este un lac de date?

A lacul de date este pur și simplu un loc pentru a vă parca date până când aveți nevoie de el și ar putea cuprinde HDFS (cel mai comun), stocare de obiecte, cutii NAS sau orice altceva. Fundamental, Elasticsearch este un instrument de indexare date , nu pentru depozitarea date în sine.

Recomandat: