Cuprins:

Cum îmi pot îmbunătăți performanța sqoop?
Cum îmi pot îmbunătăți performanța sqoop?

Video: Cum îmi pot îmbunătăți performanța sqoop?

Video: Cum îmi pot îmbunătăți performanța sqoop?
Video: How To Improve Work Performance? 2024, Noiembrie
Anonim

A optimiza performanţă , a stabilit cel numărul de sarcini de hartă la o valoare mai mică decât cel numărul maxim de conexiuni care cel suportă baze de date. Controlul cel cantitatea de paralelism care Sqoop va folosi pentru a transfera date este cel principala modalitate de control cel Încărcați ta Bază de date.

În mod corespunzător, ce se întâmplă dacă sqoop eșuează între un proces?

Un tipic Sqoop jobul care ingerează date dintr-o bază de date sursă în HDFS va copia datele într-un director țintă. Fișierul copiat va fi șters dacă sqoop eșuează fără a completa.

Cineva se poate întreba, de asemenea, cum obțineți paralelismul în sqoop? Controlul Paralelism . Sqoop importă date în paralel din majoritatea surselor de baze de date. Puteți specifica numărul de sarcini de hartă (procese paralele) de utilizat pentru a efectua importul folosind argumentul -m sau --num-mappers. Fiecare dintre aceste argumente ia o valoare întreagă care corespunde gradului de paralelism a angaja

În consecință, cum îmi îmbunătățesc performanța interogărilor Hive?

Mai jos sunt lista practicilor pe care le putem urma pentru a optimiza Hive Queries

  1. Activați compresia în Hive.
  2. Optimizați îmbinările.
  3. Evitați sortarea globală în Hive.
  4. Activați Tez Execution Engine.
  5. Optimizează operator LIMIT.
  6. Activați execuția paralelă.
  7. Activați modul strict Mapreduce.
  8. O singură reducere pentru mai multe grupuri BY.

Cum funcționează sqoop split?

Poate fi folosit pentru a îmbunătăți performanța de import prin realizarea unui paralelism mai mare. Sqoop creează despica pe baza valorilor dintr-o anumită coloană a tabelului, care este specificată de -- Despică -de către utilizator prin comanda de import. Dacă nu este disponibilă, cheia primară a tabelului de intrare este folosită pentru a crea despica.

Recomandat: