¡Descubre Apache Kafka a través de mimacom!

14 de noviembre de 2017

Kafka es una plataforma de almacenamiento, distribuido y replicado, basada en un sistema de mensajería que funciona bajo un patrón publicación-suscripción. Se trata de una tecnología Open Source empleada para construir pipeline de datos y aplicaciones de streaming en tiempo real.

Kafka se ejecuta en un clúster en uno o más servidores denominados brokers que recogen y almacenan el flujo de datos para luego enviarlos a las aplicaciones y procesarlos por bloques pequeños de forma secuencial, continúa y sin interrupciones, a medida que se van produciendo.

Estos mensajes son generados por un productor y se publican en temas (topics) que a su vez se encuentran en registros (logs), particionados y replicados. Cada partición contiene una secuencia ordenada del mensaje, listo para ser consumido por cero, uno o varios subscriptores. Cada registro admite una multitud de suscriptores, aunque cada consumidor debe suscribirse a un grupo para consumir uno o varios temas.

Los mensajes, antes de ser eliminados para liberar espacio, son mantenidos durante un tiempo predeterminado, lo que significa una ventaja para los consumidores, ya que pueden volver a leer mensajes antiguos. Para Kafka no es un problema mantener los registros durante mucho tiempo, dado que el rendimiento no disminuye.

Algunas de las características más importantes de esta innovación son su escalabilidad (masiva y horizontal) su alto rendimiento, su tolerancia a fallos y su baja latencia, además de, su agilidad y rapidez, en lecturas y escrituras.

Si quieres profundizar en el universo Kafka, no dudes en revisar estos dos artículos:

¡Esperamos que disfrutes de una buena lectura!

Sobre el autor: Tristan Fenaux
Comments
Únete a nosotros