Cum se realizează localizarea datelor în Hadoop?
Cum se realizează localizarea datelor în Hadoop?

Video: Cum se realizează localizarea datelor în Hadoop?

Video: Cum se realizează localizarea datelor în Hadoop?
Video: [SO] Cursul 09 Gestiunea fisierelor 2024, Noiembrie
Anonim

Localizarea datelor în Hadoop . Luați exemplul de număr de cuvinte, în care cele mai multe cuvinte au fost repetate de 5 Lacs sau de mai multe ori. În acest caz, după faza Mapper, fiecare ieșire mapper va avea cuvinte în intervalul de 5 Lacs. Acest proces complet de stocare a ieșirii Mapper în LFS se numește ca Localizarea datelor.

Ținând cont de acest lucru, ce este localizarea datelor în Hadoop?

Conceptul de Date localitate în Date Hadoop localitate în MapReduce se referă la capacitatea de a muta calculul aproape de locul real date rezidă pe nod, în loc să se miște mare date la calcul. Acest lucru minimizează congestionarea rețelei și crește debitul general al sistemului.

De asemenea, cum sunt stocate datele mari? Majoritatea oamenilor asociază automat HDFS, sau Hadoop Distributed File System, cu Hadoop date depozite. HDFS stochează informații în clustere care sunt alcătuite din blocuri mai mici. Aceste blocuri sunt stocate în fizic la fața locului depozitare unități, cum ar fi unitățile de disc interne.

Doar așa, cum sunt stocate datele în Hadoop?

Pe o Hadoop cluster, cel date în HDFS și sistemul MapReduce sunt găzduite pe fiecare mașină din cluster. Date este stocate în date blocuri pe DataNodes. HDFS le reproduce date blocuri, de obicei cu dimensiunea de 128 MB, și le distribuie astfel încât să fie replicate în mai multe noduri din cluster.

Cum sunt stocate fișierele în HDFS?

HDFS expune a fişier spațiu de nume de sistem și permite datelor utilizatorului să fie stocate în fișiere . Pe plan intern, a fişier este împărțit în unul sau mai multe blocuri și aceste blocuri sunt stocate într-un set de DataNodes. NameNode se execută fişier operațiuni ale spațiului de nume ale sistemului, cum ar fi deschiderea, închiderea și redenumirea fișiere și directoare.

Recomandat: