FLUXO NATIVO
Mais sinais
Microserviços, Kubernetes, filas e APIs aumentam volume e cardinalidade todos os dias.
Do primeiro span ao projeto em produção: um treinamento ao vivo de 6 módulos para operar observability de verdade, com OpenTelemetry, Apache Kafka, ClickHouse, ClickStack (HyperDX), Kubernetes, RCA e IA aplicada.
Plataformas modernas geram sinais demais, mudam rápido demais e custam caro demais para serem operadas só com dashboard e alerta genérico. SREs, DevOps, Platform Engineers e times de backend precisam entender telemetria como arquitetura: ingestão, contexto, retenção, query, custo e resposta a incidentes.
FLUXO NATIVO
Microserviços, Kubernetes, filas e APIs aumentam volume e cardinalidade todos os dias.
CUSTO
Sem modelagem e retenção, observability vira uma conta crescente que pouca gente sabe explicar.
RCA
O raro que acontece quando logs, traces e métricas respondem perguntas durante o incidente.
Observability real nasce em produção, não em tutorial. O curso parte de problemas que você já conhece: cardinalidade fora de controle, contexto perdido entre serviços, Collector subdimensionado, Apache Kafka mal dimensionado para absorver picos de ingestão e time tentando fazer RCA no escuro.
A promessa é prática: sair com repertório para desenhar uma stack, defender trade-offs e operar sinais confiáveis em cloud native, com revisão ao vivo durante a jornada.
TRACES
Span sem nome útil, atributo demais, propagação falhando e RCA virando caça ao tesouro.
METRICS
Métrica que parecia simples explode custo, degrada query e atrapalha alerta confiável.
PIPELINE
Sem fila, sem retry, sem health do próprio pipeline e sem clareza de capacidade.
QUERY
Logs, traces e métricas existem, mas não se correlacionam quando o time precisa decidir rápido.
01
Use OpenTelemetry sem explodir cardinalidade, custo ou ruído operacional.
02
ClickHouse, ClickStack, retenção, TTL e schema pensados para investigação.
03
Pipeline com OTel Collector, Fluent Bit, Apache Kafka, retry, health checks e sinais do próprio sistema.
04
Conecte MCP ao ClickStack e tenha agentes consultando seus sinais para chegar à causa raiz antes de você terminar de ler o alerta.
A jornada conecta instrumentação, coleta, buffer, armazenamento analítico e investigação. O foco é entender onde cada decisão impacta custo, latência, confiabilidade e RCA.
Elasticsearch nasceu para busca textual e indexação invertida. Em observability moderna, a investigação é agregação em alto volume, cardinalidade alta e custo previsível. ClickHouse entra como motor analítico colunar para esse workload.
NETFLIX
5 PB/diaLog em escala massiva com ClickHouse, mais de 10 milhões de eventos por segundo e queries interativas.
EDD
-30%Migração do Elasticsearch para ClickHouse em logs, com redução de custo de hardware e queries mais rápidas.
META
62xCompressão de dados não estruturados em ClickHouse com melhoria expressiva de performance.
CLICKHOUSE
10x+Compressão e retenção longa para dados OTel com tempo de query como primeira resposta.
Loki é forte para logs e tem pouco overhead. Mas a proposta aqui é correlacionar logs, traces e métricas com SQL e schema. ClickHouse e ClickStack fazem isso nativamente.
Elasticsearch é excelente para busca textual e continua útil em muitos cenários. O ponto é custo e modelo de consulta: observability em alto volume pede agregação, retenção longa, compressão, schema e SQL para investigar sinais sem transformar tudo em índice caro.
Grafana é uma ótima camada de visualização. Aqui o foco é construir a fundação que alimenta a investigação: instrumentação, coleta, buffer, armazenamento analítico e correlação. Dashboard ajuda, mas não substitui arquitetura de dados para RCA.
Números baseados em materiais públicos de ClickHouse, Netflix, Red, Sentry e Cloudflare.
Monitoramento vs observability, métricas, traces, logs, SLI, SLO, SLA, Error Budget e ODD.
SDK, API, OpenTelemetry Collector, exporters, processors, semantic conventions, Go, Java, contexto e sampling.
MergeTrees, particionamento, compressão, schema design, queries analíticas, retenção, custo e comparação com Elasticsearch.
OpenTelemetry Collector em modo agent/gateway, Fluent Bit, Apache Kafka, ClickHouse, kind/minikube, DaemonSet, HPA com KEDA, helm, Strimzi e Ability.
Retry, fila, persistent storage, multi-cluster, isolamento de ingestão/query, alertas do pipeline e capacity planning.
Agentes consultando traces e logs, RCA, runbooks gerados e limites do que automatizar.
É para você se...
Você atua com backend, plataforma, SRE ou DevOps ou arquitetura.
Você já viveu deploy, incidentes, Kubernetes, cloud ou sistemas distribuídos.
Você quer ser o "toolbelt" para desenhar pipeline confiável.
Você precisa justificar custo, retenção, sampling e schema e trade-offs técnicas.
Não é a melhor escolha se...
Você busca um curso introdutório de programação ou DevOps do zero.
Você quer apenas aprender a clicar em uma ferramenta SaaS específica.
Você não consegue reservar tempo semanal para aula ao vivo e prática.
Você espera respostas mágicas sem discutir contexto, custo e operação.
Cada sessão combina teoria aplicada, terminal aberto, decisões de arquitetura, exercícios, demos e tempo real para dúvidas. A turma é guiada semana a semana para manter ritmo, profundidade e troca entre pessoas que já vivem produção.
Quintas, 19h às 22h, em 6 encontros, totalizando 18 horas ao vivo.
Interação direta durante cada aula, com espaço para casos reais trazidos pela turma.
Entrega no GitHub para validar prática, raciocínio técnico, documentação e trade-offs.
Entrega prática revisada ao vivo: serviços instrumentados, pipeline, backend analítico e decisões de arquitetura.
A abordagem combina implementação, leitura crítica de área e decisões de operação. Não é uma coleção de ferramentas: é um sistema para diagnosticar produção com dados reais, contexto e automação onde ela faz sentido.
O fechamento do curso é um projeto com serviços instrumentados, pipeline completo, backend analítico e dashboard funcional. A revisão acontece ao vivo para transformar cada decisão em aprendizado coletivo.
O curso é conduzido por profissionais que vivem arquitetura, confiabilidade, plataforma, dados e observability em ambientes de alta exigência.
STAFF ENGINEER
Experiência em plataforma, observability e arquitetura em ambientes de alta escala. Passou por IBM, C6 Bank e Bradesco.
LinkedIn
PRINCIPAL ENGINEER
Ex-AWS principal specialist em OpenSearch para LATAM. Foco em dados, analytics e workloads críticos em produção.
LinkedInEntre, assista, avalie a profundidade técnica e veja se o formato conversa com o seu momento. Se nos primeiros 7 dias você sentir que a turma não é para você, basta pedir o reembolso. Simples, direto e profissional.
A garantia existe para você decidir com segurança.
Entrar na lista de esperaA turma é ao vivo, com tamanho controlado para preservar qualidade nas discussões, revisão de PRs e acompanhamento do projeto final. Escolha o formato que faz sentido para o seu momento.
Inscrição regular
Para quem decide entrar fora da janela da lista de espera, com vagas sujeitas à disponibilidade da turma.
Quero garantir minha vagaRECOMENDADO PARA QUEM ENTRAR NA LISTA
Lista de espera
R$ 300 de desconto garantido para quem entrar na lista e confirmar a vaga na primeira janela de abertura.
Entrar na lista de esperaTurma para empresas
Treinamento fechado, adaptado ao contexto do seu time.
Diagnóstico técnico da stack atual, labs com cenários reais de OTel Collector, Fluent Bit, Apache Kafka e ClickHouse, e agenda combinada com engenharia, plataforma, SRE ou DevOps.
Conversar no WhatsAppNão. O curso assume que você já lida com deploys, incidentes e decisões de produção. Se você nunca viu um span, uma métrica ou um pipeline de logs, vale estudar fundamentos antes.
Não precisa dominar. O curso começa do SDK, mas assume maturidade de engenharia para entender trade-offs.
As aulas acontecem às quintas, das 19h às 22h. A proposta é aprender junto, tirar dúvidas ao vivo. Às gravações ficam disponíveis por até 1 ano para revisão.
Sim. Cada módulo tem lab, exercício ou estudo de caso, e as entregas principais acontecem via PR no GitHub.
Os dois aparecem. A base é self-hosted com ClickHouse, Apache Kafka, OTel Collector, Fluent Bit e ClickStack, mas decisões SaaS entram nos comparativos.
Sim. A turma terá um espaço exclusivo para troca com os instrutores e com outros alunos. A ideia é aproximar quem está vivendo problemas parecidos em produção, compartilhar dúvidas, discutir decisões de arquitetura e manter a conversa viva fora das aulas.
Entre na lista para receber data, condição antecipada, pré-requisitos e detalhes da matrícula. Sem spam. A gente fala com você quando a turma abrir.
Vamos te conhecer rapidinho. São poucos passos, leva menos de um minuto e garante prioridade na próxima turma.
Pronto! Você está na lista. Vamos confirmar tudo por e-mail e WhatsApp assim que a próxima turma abrir.