Emilio Jiménez

Estudiante de ASIR

Etiqueta: big data

Cassandra

La base de datos Apache Cassandra es la elección correcta cuando se necesita una alta disponibilidad y escalabilidad sin comprometer el rendimiento. Escalabilidad lineal y probada tolerancia a fallos en el hardware de los productos básicos o infraestructura en la nube hacen que sea la plataforma perfecta para los datos de misión crítica. El apoyo de Cassandra para replicar a través de múltiples centros de datos es la mejor en su clase, con una latencia más baja para sus usuarios y la tranquilidad de saber que se puede sobrevivir cortes regionales.

Kafka

Una plataforma de streaming tiene tres funciones principales:

  • Publicar y suscribirse a corrientes de registros, de forma similar a un sistema de mensajería cola de mensajes o de la empresa.
  • flujos de tienda de discos de una manera duradera con tolerancia a fallos.
  • Corrientes de proceso de los registros a medida que ocurren.

Kafka se utiliza generalmente para dos amplias clases de aplicaciones:

  • La construcción de transmisión en tiempo real de datos de tuberías que llegar fiable de datos entre los sistemas o aplicaciones
  • La construcción de transmisión en tiempo real aplicaciones que transforman o reaccionan a los flujos de datos

Para entender cómo Kafka hace estas cosas, vamos a bucear y explorar las capacidades de Kafka de abajo hacia arriba.

En primer lugar algunos conceptos:

  • Kafka se ejecuta como un clúster en uno o más servidores que pueden abarcar varios centros de datos.
  • Las tiendas de racimo Kafka corrientes de registros en categorías denominadas temas .
  • Cada registro se compone de una clave, un valor y una marca de tiempo.

© 2019 Emilio Jiménez

Tema por Anders NorenArriba ↑