ClickHouse

March 2, 2021
Clickhouse es un sistema de gestión de bases de datos (DBMS) orientado a columnas de código abierto que se utiliza para el procesamiento analítico en línea (OLAP) creado por Yandex. Actualmente, impulsa la segunda plataforma de análisis web más grande, Yandex Metrica. También puede considerarse el primer almacén de datos SQL de código abierto que jamás haya igualado la escalabilidad y el rendimiento de bases de datos como Veryica y Snowflake.

Lanzado en código abierto en 2016, ClickHouse es utilizado por Yandex para fines de KPI y monitoreo de accesibilidad del sitio. También se ha implementado en el experimento LHCb del CERN, donde almacena y procesa metadatos en 10 mil millones de eventos que albergan más de 1000 atributos en un evento.

Clickhouse es utilizado principalmente por analistas/ingenieros de DevOps/Desarrolladores, Startups que buscan análisis de alta calidad con bajo capital y empresas que pagan grandes cantidades de dinero por la arquitectura.

Cómo funciona Clickhouse

A diferencia de la mayoría de las bases de datos propietarias, el desarrollo de Clickhouse es impulsado por una comunidad comprometida compuesta por cientos de colaboradores enfocados en crear una mejor funcionalidad y resolver problemas que pueden degradar su rendimiento.

Al utilizar todo el hardware disponible para procesar cada consulta, la aplicación puede procesar desde 100 millones hasta más de mil millones de filas y gigas de datos por ciclo de servidor de un segundo.

Clickhouse permite a las empresas y desarrolladores agregar servidores a sus clústeres sin inyectar muchos recursos en la modificación de DBMS.

Características de Clickhouse

Estas son algunas de las principales características de ClickHouse DBMS:

  • Ofrece escalabilidad lineal
  • Almacenamiento y procesamiento de petabytes de datos
  • Compresión de datos
  • Optimización de HDD
  • Tolerancia a fallos
  • Alto rendimiento, por ejemplo, el procesamiento de consultas distribuidas y paralelas
  • Soporte para SQL

Ventajas de ClickHouse

  • Procesamiento distribuido en varios servidores
  • Es fácil de configurar y tiene buena documentación y comunidad
  • ClickHouse es eficaz cuando se trabaja con tablas desnormalizadas/anchas
  • Soporte de índice
  • Escaneos rápidos que se pueden utilizar para consultas en tiempo real
  • Utilización de múltiples núcleos en procesamiento paralelo para consultas únicas
  • Línea de comandos fácil de usar
Utilizamos cookies para optimizar la funcionalidad del sitio y ofrecerle la mejor experiencia posible. Para saber más sobre las cookies que utilizamos, visite nuestra Política de Cookies. Al hacer clic en "Aceptar", aceptas el uso que hacemos de las cookies. Más información