Observability 360 | Do primeiro span ao projeto em produção

OPORTUNIDADE DE MERCADO

Observability virou competência de engenharia, não responsabilidade de uma ferramenta.

Plataformas modernas geram sinais demais, mudam rápido demais e custam caro demais para serem operadas só com dashboard e alerta genérico. SREs, DevOps, Platform Engineers e times de backend precisam entender telemetria como arquitetura: ingestão, contexto, retenção, query, custo e resposta a incidentes.

FLUXO NATIVO

Mais sinais

Microserviços, Kubernetes, filas e APIs aumentam volume e cardinalidade todos os dias.

CUSTO

Menos desperdício

Sem modelagem e retenção, observability vira uma conta crescente que pouca gente sabe explicar.

RCA

Menos chute

O raro que acontece quando logs, traces e métricas respondem perguntas durante o incidente.

PARA QUEM JÁ VIVE PRODUÇÃO

Observability sem slide bonito e dashboard inútil.

Observability real nasce em produção, não em tutorial. O curso parte de problemas que você já conhece: cardinalidade fora de controle, contexto perdido entre serviços, Collector subdimensionado, Apache Kafka mal dimensionado para absorver picos de ingestão e time tentando fazer RCA no escuro.

A promessa é prática: sair com repertório para desenhar uma stack, defender trade-offs e operar sinais confiáveis em cloud native, com revisão ao vivo durante a jornada.

ONDE A STACK COSTUMA QUEBRAR

Se sua telemetria não ajuda no incidente, ela só está gerando custo.

TRACES

Contexto perdido entre serviços

Span sem nome útil, atributo demais, propagação falhando e RCA virando caça ao tesouro.

METRICS

Cardinalidade fora de controle

Métrica que parecia simples explode custo, degrada query e atrapalha alerta confiável.

PIPELINE

Collector frágil em produção

Sem fila, sem retry, sem health do próprio pipeline e sem clareza de capacidade.

QUERY

Dados que não respondem perguntas

Logs, traces e métricas existem, mas não se correlacionam quando o time precisa decidir rápido.

O que você vai aprender

01

Instrumente com critério

Use OpenTelemetry sem explodir cardinalidade, custo ou ruído operacional.

02

Modele para query real

ClickHouse, ClickStack, retenção, TTL e schema pensados para investigação.

03

Opere sob pressão

Pipeline com OTel Collector, Fluent Bit, Apache Kafka, retry, health checks e sinais do próprio sistema.

04

Use IA com contexto

Conecte MCP ao ClickStack e tenha agentes consultando seus sinais para chegar à causa raiz antes de você terminar de ler o alerta.

PROJETO FINAL

Entregue uma stack completa de observability.

O fechamento do curso é um projeto com serviços instrumentados, pipeline completo, backend analítico e dashboard funcional. A revisão acontece ao vivo para transformar cada decisão em aprendizado coletivo.

✓ Dois serviços instrumentados: Go e Java

✓ OpenTelemetry Collector com pipeline completo

✓ Apache Kafka como camada de desacoplamento e absorção de picos de ingestão

✓ ClickHouse como backend de observability

✓ ClickStack como experiência principal de investigação

✓ README com decisões de arquitetura e trade-offs

PRÓXIMA TURMA

Três formas de entrar para o Observability 360.

A turma é ao vivo, com tamanho controlado para preservar qualidade nas discussões, revisão de PRs e acompanhamento do projeto final. Escolha o formato que faz sentido para o seu momento.

Inscrição regular

R$ 2.197

Para quem decide entrar fora da janela da lista de espera, com vagas sujeitas à disponibilidade da turma.

18 horas ao vivo em 6 encontros às quintas
Revisão de exercícios e do projeto final
Acesso às gravações por 1 ano
7 dias de garantia profissional

RECOMENDADO PARA QUEM ENTRAR NA LISTA

Lista de espera

R$ 1.997

R$ 300 de desconto garantido para quem entrar na lista e confirmar a vaga na primeira janela de abertura.

Entrar na lista de espera

18 horas ao vivo em 6 encontros às quintas
Revisão de exercícios e do projeto final
Acesso às gravações por 1 ano
7 dias de garantia profissional
Prioridade de vaga sobre inscrição regular

Turma para empresas

Treinamento fechado, adaptado ao contexto do seu time.

Diagnóstico técnico da stack atual, labs com cenários reais de OTel Collector, Fluent Bit, Apache Kafka e ClickHouse, e agenda combinada com engenharia, plataforma, SRE ou DevOps.

Conversar no WhatsApp

Diagnóstico de arquitetura, custo e cardinalidade
Conteúdo e labs adaptados ao stack do time
Turma fechada, com agenda combinada
Proposta sob consulta, conforme escopo

FAQ

Antes de entrar na lista.

É para iniciante?

Não. O curso assume que você já lida com deploys, incidentes e decisões de produção. Se você nunca viu um span, uma métrica ou um pipeline de logs, vale estudar fundamentos antes.

Preciso saber OpenTelemetry?

Não precisa dominar. O curso começa do SDK, mas assume maturidade de engenharia para entender trade-offs.

Vou conseguir acompanhar ao vivo?

As aulas acontecem às quintas, das 19h às 22h. A proposta é aprender junto, tirar dúvidas ao vivo. Às gravações ficam disponíveis por até 1 ano para revisão.

Vai ter mão na massa?

Sim. Cada módulo tem lab, exercício ou estudo de caso, e as entregas principais acontecem via PR no GitHub.

É SaaS ou self-hosted?

Os dois aparecem. A base é self-hosted com ClickHouse, Apache Kafka, OTel Collector, Fluent Bit e ClickStack, mas decisões SaaS entram nos comparativos.

Vou ter contato com os instrutores?

Sim. A turma terá um espaço exclusivo para troca com os instrutores e com outros alunos. A ideia é aproximar quem está vivendo problemas parecidos em produção, compartilhar dúvidas, discutir decisões de arquitetura e manter a conversa viva fora das aulas.

Observability virou competência de engenharia, não responsabilidade de uma ferramenta.

Mais sinais

Menos desperdício

Menos chute

Observability sem slide bonito e dashboard inútil.

Se sua telemetria não ajuda no incidente, ela só está gerando custo.

Contexto perdido entre serviços

Cardinalidade fora de controle

Collector frágil em produção

Dados que não respondem perguntas

O que você vai aprender

Instrumente com critério

Modele para query real

Opere sob pressão

Use IA com contexto

O pipeline que você vai montar, operar e defender tecnicamente.

Por que ClickHouse e não só Elasticsearch?

Por que não é Loki?

Por que não é Elasticsearch?

Por que não é Grafana?

Seis módulos para sair de sinais soltos para uma operação observável.

Fundamentos de Observability

OpenTelemetry do zero à produção

ClickHouse como backend analítico

Infraestrutura, ingestão e logs

Resiliência e Escala em Produção

IA e MCP em Observability

Feito para quem precisa operar, defender arquitetura e responder incidente.

Ao vivo. Toda quinta. Das 19h às 22h.

Aulas ao vivo

Dúvidas em tempo real

Exercícios via PR

Projeto final

Você aprende olhando para arquitetura, código, terminal e query.

Entregue uma stack completa de observability.

Você não precisa chegar especialista. Precisa chegar com base e vontade de abrir o terminal.

Conhecimento esperado

Setup recomendado

O que você leva

Aprenda com quem opera engenharia em escala.

Luis Vinhali

Rafael Gumiero

Teste por 7 dias com tranquilidade.

Três formas de entrar para o Observability 360.

Antes de entrar na lista.

Quer ser avisado quando a próxima turma abrir?