Disco MapReduce

Disco MapReduce

Disco es un marco ligero y de código abierto para la computación distribuida basada en el paradigma MapReduce y escrito en Python.
Disco es una implementación de mapreduce para computación distribuida.Disco admite cálculos paralelos sobre grandes conjuntos de datos, almacenados en un grupo de computadoras poco confiable, como en el marco original creado por Google.Esto lo convierte en una herramienta perfecta para analizar y procesar grandes conjuntos de datos, sin tener que preocuparse por los tecnicismos difíciles relacionados con la distribución, como protocolos de comunicación, equilibrio de carga, bloqueo, programación de trabajos y tolerancia a fallas, que maneja Disco.

Caracteristicas

Categorias

Alternativas a Disco MapReduce para todas las plataformas con cualquier licencia

Apache Hadoop

Apache Hadoop

Apache Hadoop es un marco de software de código abierto que admite aplicaciones distribuidas de uso intensivo de datos con licencia bajo la licencia Apache v2.
Apache Spark

Apache Spark

Apache Spark ™ es un motor rápido y general para el procesamiento de datos a gran escala. Programas SpeedRun hasta 100 veces más rápido que Hadoop MapReduce en la memoria, o 10 veces más rápido en el disco.
Amazon Kinesis

Amazon Kinesis

Los servicios de Amazon Kinesis facilitan el trabajo con transmisión de datos en tiempo real en la nube de AWS.
dispy

dispy

dispy es un marco de Python para la ejecución paralela de cálculos distribuyéndolos a través de múltiples procesadores en una sola máquina (SMP), entre muchas máquinas en un clúster o ...