¿Cuándo usar el acumulador?

Tabla de contenido:

¿Cuándo usar el acumulador?
¿Cuándo usar el acumulador?
Anonim

Los acumuladores son variables que solo se "añaden" a través de una operación asociativa y, por lo tanto, pueden admitirse de manera eficiente en paralelo. Se pueden usar para implementar contadores (como en MapReduce) o sumas. Spark admite de forma nativa acumuladores de tipos numéricos y los programadores pueden agregar compatibilidad con nuevos tipos.

¿Por qué usamos el acumulador?

Los acumuladores hidráulicos se utilizan en una amplia variedad de industrias para almacenar energía; mantener la presión; amortiguar vibraciones, pulsaciones y golpes; y mucho más. Almacenamiento de energía: los acumuladores pueden aceptar, almacenar y liberar energía en forma de fluido presurizado para mejorar la eficiencia de su sistema hidráulico.

¿Cuál es la diferencia entre transmisión y acumulación en Spark?

La diferencia clave entre una variable de transmisión y un acumulador es que mientras la variable de transmisión es de solo lectura, se puede agregar al acumulador. … Cada nodo trabajador solo puede acceder y agregar a su propio valor acumulador local, y solo el programa controlador puede acceder al valor global.

¿Cómo funciona el acumulador Spark?

Los acumuladores son variables que se utilizan para agregar información entre los ejecutores. Por ejemplo, esta información puede pertenecer a datos o diagnósticos de API, como cuántos registros están dañados o cuántas veces se llamó a una API de biblioteca en particular.

¿Por qué el trabajador no debe usar la variable acumuladora en Spark para operaciones de transformación?

El acumulador dará una salida incorrecta. Si una tarea se está ejecutando lentamente, Spark puede lanzar una copia especulativa de esa tarea en otro nodo. Veredicto: No manejado. El acumulador dará una salida incorrecta.

Recomendado: