Ce este difuzarea scânteii?
Ce este difuzarea scânteii?

Video: Ce este difuzarea scânteii?

Video: Ce este difuzarea scânteii?
Video: După 25 de ani: Scânteia Adevărului 2024, Noiembrie
Anonim

Difuzare variabile în Apache Scânteie este un mecanism pentru partajarea variabilelor între executanți care sunt menite să fie doar pentru citire. Fără difuzat variabile aceste variabile ar fi livrate fiecărui executant pentru fiecare transformare și acțiune, iar acest lucru poate cauza supraîncărcare a rețelei.

La fel, oamenii se întreabă, când ar trebui să transmit scânteie?

Difuzare variabilele sunt utilizate mai ales atunci când sarcinile din mai multe etape necesită aceleași date sau când este necesară stocarea în cache a datelor în forma deserializată. Difuzare variabilele sunt create folosind o variabilă v apelând SparkContext.

De asemenea, ce sunt acumulatorii și variabilele de difuzare în scânteie? Scânteie acceptă două tipuri de partajare variabile : variabile de difuzare , care poate fi folosit pentru a stoca în cache o valoare în memorie pe toate nodurile și acumulatoare , care sunt variabile care sunt doar „adăugate”, cum ar fi contoare și sume.

Având în vedere acest lucru, ce este acumulatorul de scântei?

Acumulatoare sunt variabile care sunt doar „adăugate” printr-o operație asociativă și, prin urmare, pot fi susținute eficient în paralel. Ele pot fi folosite pentru a implementa contoare (ca în MapReduce) sau sume. Scânteie suportă nativ acumulatoare de tipuri numerice, iar programatorii pot adăuga suport pentru noi tipuri.

Cum îmi actualizez variabila de difuzare în spark?

  1. Mutați căutarea datelor de referință într-o forEachPartition sau forEachRdd, astfel încât să se afle în întregime pe lucrători.
  2. Reporniți contextul Spark de fiecare dată când se schimbă datele de referință, cu o nouă variabilă de difuzare.

Recomandat: