El núcleo de Flink es un motor de flujo de datos de transmisión que proporciona distribución de datos, comunicación y tolerancia a fallas para cálculos distribuidos a través de flujos de datos.Flink incluye varias API para crear aplicaciones que utilizan el motor Flink: API DataSet para datos estáticos incrustados en Java, Scala y Python, API DataStream para transmisiones ilimitadas incrustadas en Java y Scala, y API Table con un lenguaje de expresión similar a SQL incrustado enJava y Scala.Flink también agrupa bibliotecas para casos de uso específicos del dominio: biblioteca de Machine Learning y Gelly, una API y biblioteca de procesamiento de gráficos.Puede integrar Flink fácilmente con otros sistemas de código abierto conocidos tanto para la entrada y salida de datos como para la implementación.(Anteriormente estratosfera)
Sitio web:
http://flink.apache.orgCategorias
Alternativas a Apache Flink para Linux
27
18
Apache Hadoop
Apache Hadoop es un marco de software de código abierto que admite aplicaciones distribuidas de uso intensivo de datos con licencia bajo la licencia Apache v2.
9
Apache Spark
Apache Spark ™ es un motor rápido y general para el procesamiento de datos a gran escala. Programas SpeedRun hasta 100 veces más rápido que Hadoop MapReduce en la memoria, o 10 veces más rápido en el disco.
1
Disco MapReduce
Disco es un marco ligero y de código abierto para la computación distribuida basada en el paradigma MapReduce y escrito en Python.