Apache Spark

Apache Spark

Apache Spark ™ es un motor rápido y general para el procesamiento de datos a gran escala. Programas SpeedRun hasta 100 veces más rápido que Hadoop MapReduce en la memoria, o 10 veces más rápido en el disco.
Apache Spark ™ es un motor rápido y general para el procesamiento de datos a gran escala.Speed ​​Run programa hasta 100 veces más rápido que Hadoop MapReduce en la memoria, o 10 veces más rápido en el disco.Spark tiene un motor de ejecución de DAG avanzado que admite el flujo de datos cíclicos y la computación en memoria.

Categorias

Alternativas a Apache Spark para Windows

Apache Hadoop

Apache Hadoop

Apache Hadoop es un marco de software de código abierto que admite aplicaciones distribuidas de uso intensivo de datos con licencia bajo la licencia Apache v2.
Disco MapReduce

Disco MapReduce

Disco es un marco ligero y de código abierto para la computación distribuida basada en el paradigma MapReduce y escrito en Python.