ClickHouse

March 2, 2021
O Clickhouse é um Sistema de Gerenciamento de Banco de Dados (SGBD) de código aberto, orientado a colunas, usado para processamento analítico online (OLAP), criado pela Yandex. Atualmente, ele alimenta a segunda maior plataforma de análise da web, a Yandex Metrica. Também pode ser considerado o primeiro data warehouse SQL de código aberto a igualar a escalabilidade e o desempenho de bancos de dados como Veryica e Snowflake.

Lançado em código aberto em 2016, o ClickHouse é usado pelo Yandex para fins de KPIs e monitoramento de acessibilidade de sites. Ele também foi implementado no experimento LHCb do CERN, onde armazena e processa metadados de 10 bilhões de eventos, abrigando mais de 1.000 atributos em um único evento.

O ClickHouse é usado principalmente por analistas/engenheiros de DevOps/desenvolvedores, startups que buscam análises de alta qualidade com baixo investimento e empresas que investem altos valores em arquitetura.

Como o ClickHouse Opera

Ao contrário da maioria dos bancos de dados proprietários, o desenvolvimento do ClickHouse é impulsionado por uma comunidade comprometida, composta por centenas de colaboradores focados em criar melhores funcionalidades e solucionar problemas que podem prejudicar seu desempenho.

Utilizando todo o hardware disponível para processar cada consulta, o aplicativo pode processar de 100 milhões a mais de um bilhão de linhas e gigabytes de dados por ciclo de servidor de um segundo.

O ClickHouse permite que empresas e desenvolvedores adicionem servidores aos seus clusters sem investir muitos recursos na modificação do SGBD.

Recursos do ClickHouse

Aqui estão alguns dos principais recursos do SGBD ClickHouse:

  • Oferece escalabilidade linear
  • Armazenamento e processamento de petabytes de dados
  • Compactação de dados
  • Otimização de HDD
  • Tolerância a falhas
  • Alto desempenho, como processamento de consultas distribuídas e paralelas
  • Suporte a SQL

Vantagens do ClickHouse

  • Processamento distribuído em vários servidores
  • Fácil de configurar e possui boa documentação e comunidade
  • O ClickHouse é eficaz ao trabalhar com tabelas desnormalizadas/amplas
  • Suporte a índices
  • Varreduras rápidas que podem ser utilizadas para consultas em tempo real
  • Utilização de múltiplos núcleos em processamento paralelo para consultas únicas
  • Linha de comando amigável