1
Disco es una implementación de mapreduce para computación distribuida.Disco admite cálculos paralelos sobre grandes conjuntos de datos, almacenados en un grupo de computadoras poco confiable, como en el marco original creado por Google.Esto lo convierte en una herramienta perfecta para analizar y procesar grandes conjuntos de datos, sin tener que preocuparse por los tecnicismos difíciles relacionados con la distribución, como protocolos de comunicación, equilibrio de carga, bloqueo, programación de trabajos y tolerancia a fallas, que maneja Disco.
Sitio web:
http://discoproject.org/Caracteristicas
Categorias
Alternativas a Disco MapReduce para Windows
18
Apache Hadoop
Apache Hadoop es un marco de software de código abierto que admite aplicaciones distribuidas de uso intensivo de datos con licencia bajo la licencia Apache v2.
9
Apache Spark
Apache Spark ™ es un motor rápido y general para el procesamiento de datos a gran escala. Programas SpeedRun hasta 100 veces más rápido que Hadoop MapReduce en la memoria, o 10 veces más rápido en el disco.