Què és l'emissió d'espurna?
Què és l'emissió d'espurna?

Vídeo: Què és l'emissió d'espurna?

Vídeo: Què és l'emissió d'espurna?
Vídeo: ESPURNA 22 - ¿QUÉ ES EL TIEMPO? con el FÍSICO Adrián Baños 2024, Maig
Anonim

Transmissió variables a Apache Espurna és un mecanisme per compartir variables entre executors que només són de lectura. Sense emissió variables, aquestes variables s'enviarien a cada executor per a cada transformació i acció, i això pot provocar una sobrecàrrega de xarxa.

De la mateixa manera, la gent es pregunta, quan he d'emetre l'espurna?

Transmissió Les variables s'utilitzen principalment quan les tasques en diverses etapes requereixen les mateixes dades o quan es requereix la memòria cau de les dades en forma deserialitzada. Transmissió les variables es creen mitjançant una variable v cridant a SparkContext.

A més, què són els acumuladors i les variables d'emissió a l'espurna? Espurna Admet dos tipus de compartit les variables : variables de difusió , que es pot utilitzar per emmagatzemar un valor a la memòria en tots els nodes, i acumuladors , que són les variables que només s'hi "afegeixen", com ara comptadors i sumes.

Tenint en compte això, què és l'acumulador d'espurnes?

Acumuladors són variables que només s'hi "afegeixen" mitjançant una operació associativa i, per tant, es poden suportar de manera eficient en paral·lel. Es poden utilitzar per implementar comptadors (com a MapReduce) o sumes. Espurna suporta de manera nativa acumuladors de tipus numèrics i els programadors poden afegir suport per a nous tipus.

Com actualitzo la meva variable d'emissió a spark?

  1. Moveu la cerca de dades de referència a forEachPartition o forEachRdd de manera que resideixi completament en els treballadors.
  2. Reinicieu el context Spark cada vegada que canvien les dades de referència, amb una nova variable de difusió.

Recomanat: