Ce este DistCp în Hadoop?
Ce este DistCp în Hadoop?

Video: Ce este DistCp în Hadoop?

Video: Ce este DistCp în Hadoop?
Video: Hadoop Day to Day Operations - Distcp - Data back ups and migration 2024, Noiembrie
Anonim

DistCp (copie distribuită) este un instrument utilizat pentru copierea mare între/intra-cluster. Folosește MapReduce să efectueze distribuția, gestionarea și recuperarea erorilor și raportarea. Acesta extinde o listă de fișiere și directoare în sarcini de intrare pentru a mapa, fiecare dintre acestea va copia o partiție a fișierelor specificate în lista sursă.

În mod similar, cineva se poate întreba, suprascrie Distcp?

De asemenea, ar trebui să detaliez câteva și să explic asta distcp - suprascrie voi suprascrie fișierul indiferent dacă dimensiunea se potrivește sau nu. Aceasta va actualiza toate fișierele din hdfs-nn2 care nu se potrivesc ca dimensiune cu hdfs-nn1, precum și va șterge orice fișiere străine.

În mod similar, ce este comanda Hadoop FS? Sistemul de fișiere ( FS ) shell include diverse tipuri de shell comenzi care interacționează direct cu Hadoop Sistem de fișiere distribuit ( HDFS ) precum și alte sisteme de fișiere care Hadoop suporturi, cum ar fi Local FS , HFTP FS , S3 FS , si altii.

În acest fel, cum pot transfera date de la un Hdfs la altul Hdfs?

Hadoop fs cp – Cel mai ușor mod de a copia datele dintr-unul directorul sursă către o alta . Folosește hadoop fs -cp [sursă] [destinație]. Hadoop fs copyFromLocal – Trebuie copiați datele din sistemul de fișiere local în HDFS ? Folosește hadoop fs -copyFromLocal [sursa] [destinație].

Cum copiez un cluster dintr-un cluster în altul?

Copiere fișiere între clustere . Poti copiați fișierele sau directoare între diferite clustere folosind comanda hadoop distcp. Trebuie să includeți o acreditări fişier în dumneavoastră copie cere deci sursa cluster poate valida că sunteți autentificat la sursă cluster și ținta cluster.

Recomandat: