Disco MapReduce

Disco es un marco ligero y de código abierto para la computación distribuida basada en el paradigma MapReduce y escrito en Python.

Gratis
Windows
Mac
Linux

Disco es una implementación de mapreduce para computación distribuida.Disco admite cálculos paralelos sobre grandes conjuntos de datos, almacenados en un grupo de computadoras poco confiable, como en el marco original creado por Google.Esto lo convierte en una herramienta perfecta para analizar y procesar grandes conjuntos de datos, sin tener que preocuparse por los tecnicismos difíciles relacionados con la distribución, como protocolos de comunicación, equilibrio de carga, bloqueo, programación de trabajos y tolerancia a fallas, que maneja Disco.

Alternativas a Disco MapReduce para todas las plataformas con cualquier licencia

Apache Hadoop

Apache Hadoop es un marco de software de código abierto que admite aplicaciones distribuidas de uso intensivo de datos con licencia bajo la licencia Apache v2.

Gratis
Windows
Mac
Linux

Apache Spark

Apache Spark ™ es un motor rápido y general para el procesamiento de datos a gran escala. Programas SpeedRun hasta 100 veces más rápido que Hadoop MapReduce en la memoria, o 10 veces más rápido en el disco.

Gratis
Windows
Mac
Linux

Amazon Kinesis

Los servicios de Amazon Kinesis facilitan el trabajo con transmisión de datos en tiempo real en la nube de AWS.

De pago
Web

Apache Flink

HPCC Systems

Linux

dispy

dispy es un marco de Python para la ejecución paralela de cálculos distribuyéndolos a través de múltiples procesadores en una sola máquina (SMP), entre muchas máquinas en un clúster o ...

Gratis
Windows
Mac
Linux