Ficha de leitura crítica em 18 perguntas — desenho, viéses, resultados, NNT e aplicabilidade clínica do primeiro trial cabeça-a-cabeça entre o dual-agonista GIP/GLP-1 e o monoagonista GLP-1 em adultos com obesidade sem diabetes.
As perguntas 1–2 da ficha tratam da motivação científica do estudo. Por que o ensaio foi conduzido? Qual a hipótese conceitual?
Doença, tratamentos padrão, farmacodinâmica/farmacocinética dos dois agentes, lacuna de evidência que motivou o trial.
A doença. A obesidade é uma doença crônica, recidivante e multifatorial, com prevalência global crescente. No estudo, o IMC médio basal foi 39,4 kg/m² (obesidade grau II–III) e os pacientes acumulavam ~16 anos de obesidade, com 50% apresentando duas ou mais complicações relacionadas. As morbidades atreladas (hipertensão, dislipidemia, apneia obstrutiva do sono — AOS, doença cardiovascular) explicam por que ela é um alvo terapêutico de alto impacto.
Tratamento padrão pré-incretinas. Modificação de estilo de vida (dieta hipocalórica + exercício) produz perdas modestas (5–10%) e baixa sustentabilidade. Cirurgia bariátrica produz perdas robustas (25–30%) mas é invasiva e tem critérios restritivos. Fármacos anteriores (orlistate, naltrexona-bupropiona, fentermina-topiramato) ofereciam perdas de 5–10% com efeitos colaterais limitantes.
Farmacologia dos comparadores.
A lacuna que motivou o estudo. Até maio de 2025, nenhum trial cabeça-a-cabeça havia comparado os dois agentes em adultos com obesidade sem diabetes. Comparações indiretas (cross-trial) sugeriam superioridade do tirzepatide, mas eram passíveis de confundimento por diferenças populacionais. Restava equipoise clínico legítimo para uma decisão entre os agentes — o que o trial busca resolver.
A hipótese conceitual é uma afirmação biológica/farmacológica geral — não confunda com a hipótese estatística (nula).
Hipótese conceitual: em adultos com obesidade sem diabetes tipo 2, o dual-agonismo GIP/GLP-1 (tirzepatide) produz redução de peso corporal clinicamente superior à do monoagonismo GLP-1 (semaglutide), por meio de mecanismos farmacológicos complementares — agindo simultaneamente em centros hipotalâmicos do apetite e diretamente em adipócitos via receptor de GIP.
Em termos mais operacionais: "adicionar ação GIP ao agonismo GLP-1 amplifica a magnitude da perda de peso além do que se obtém com GLP-1 isolado".
Perguntas 3–5: delineamento, critérios de seleção, intervenções comparadas.
Trata-se de um ensaio clínico de fase 3b, multicêntrico, paralelo, randomizado 1:1, controlado e open-label (aberto), conduzido em 32 sítios nos EUA e Porto Rico entre abril de 2023 e novembro de 2024, com seguimento de 72 semanas.
Por que fase 3b? Fase 3 = estudos pivotais que estabelecem eficácia/segurança para registro. O sufixo "b" indica que o trial foi conduzido após a aprovação inicial do fármaco, geralmente para responder questões adicionais (comparações cabeça-a-cabeça, populações novas, doses).
Equipoise e ausência de placebo: a opção por braço ativo (sem placebo) é defensável eticamente — ambos os fármacos já têm eficácia estabelecida, e privar pacientes do tratamento padrão por 72 semanas seria questionável.
Estratificada por IMC basal (< 35 vs ≥ 35), sexo, e status de pré-diabetes (definido por testes laboratoriais em jejum no screening).
Distribuição racial/étnica: 76,1% brancos, 19,2% negros, 2,4% asiáticos, 26,1% Hispanic/Latino — diversidade etnoracial relativamente boa para um trial NEJM, mas com sub-representação populacional global (especialmente Sul Global, Ásia oriental, indígenas).
Ambos os fármacos foram administrados subcutâneos, uma vez por semana, por 72 semanas, em dose máxima tolerada — esquema de escalonamento progressivo.
Perguntas 6–9: o que foi medido, como, qual a hipótese nula, e como os autores se protegeram de erros sistemáticos e aleatórios.
Desfecho primário: mudança percentual no peso corporal da linha de base à semana 72.
Como foi medido: peso aferido em consulta presencial, comparado ao basal. A estimativa central usou um modelo de análise de covariância (ANCOVA) com tratamento, fatores de estratificação (pré-diabetes, sexo, IMC) e valor basal como covariáveis.
Desfechos secundários-chave (também ajustados para multiplicidade):
Desfechos secundários adicionais (sem ajuste de multiplicidade): redução ≥30%, mudança em kg, mudança em IMC, pressão arterial, HbA1c, glicemia de jejum, lipídios, eventos adversos.
Peso e composição corporal são alvos diretos da intervenção e fortemente associados a melhora cardiometabólica. Porém, peso é um desfecho intermediário (surrogate) — o desfecho clinicamente "duro" final seria redução de eventos cardiovasculares maiores (MACE), mortalidade ou remissão de comorbidades (e.g., AOS, DM2).
O SELECT trial (semaglutide) já demonstrou redução de MACE com semaglutide. Para tirzepatide, o SURMOUNT-MMO (em curso) responderá essa pergunta. Até lá, a inferência aqui é sobre eficácia ponderal, não sobre desfechos duros.
Adultos ≥ 18 anos com obesidade (IMC ≥30, ou ≥27 com pelo menos uma complicação relacionada) sem diabetes, com tentativa dietética malsucedida prévia.
Tirzepatide SC, 1×/semana, em dose máxima tolerada (10 mg ou 15 mg), por 72 semanas.
Semaglutide SC, 1×/semana, em dose máxima tolerada (1,7 mg ou 2,4 mg), por 72 semanas.
Mudança percentual média no peso corporal da linha de base à semana 72 — medida de associação: diferença de médias entre grupos (em pontos percentuais).
"Em adultos com obesidade sem diabetes, não há diferença na variação percentual média do peso corporal em 72 semanas entre tirzepatide (10 ou 15 mg/sem) e semaglutide (1,7 ou 2,4 mg/sem) — ou seja, a diferença entre médias é igual a zero."
Formalmente: μtirzepatide − μsemaglutide = 0
"Existe diferença entre as duas intervenções na variação percentual de peso (μtirzepatide − μsemaglutide ≠ 0)."
Os autores planejaram o estudo para detectar uma diferença de 3 pontos percentuais, embora o teste seja bilateral (não pré-especifica direção).
Randomização computacional via sistema interativo de resposta web (IWRS), com estratificação por IMC, sexo e pré-diabetes. Procedimento adequado.
Sistema centralizado eletrônico (IWRS) — investigadores não tinham acesso prévio à sequência. Procedimento adequado.
Open-label. Pacientes e equipe sabiam o fármaco. Pode influenciar adesão, comportamento alimentar, motivação, expectativa de eficácia. Tirzepatide é o "produto novo e mais discutido na mídia" — possível efeito de expectativa.
Peso e cintura são desfechos objetivos (mensurações em balança/fita) — risco menor. Mas eventos adversos (náusea, fadiga, reação local) dependem de relato subjetivo. Em open-label, há viés de notificação assimétrico.
Descontinuação: 14,9% (tirz) vs 19,8% (sema) — assimétrica mas razoável. Estimand modificado tratou descontinuação como evento. Múltipla imputação via regras de Rubin.
Protocolo registrado em clinicaltrials.gov (NCT05822830) e publicado no NEJM como suplemento. Todos os endpoints declarados foram reportados.
Eli Lilly (fabricante do tirzepatide) desenhou o estudo, fez monitoramento, coletou e analisou os dados. Autores principais (primeiro e último) escreveram o manuscrito. Acordos de confidencialidade. Viés do patrocinador é um fator real e bem documentado na literatura em ensaios industriais.
76% brancos, 65% mulheres, populacionalmente concentrado em EUA. Exclui DM, cirurgia prévia, GLP-1 recente. Aplicabilidade ao Brasil/SUS é limitada (ver Q13).
Endpoints primário e secundários-chave (≥10%, ≥15%, ≥20%, ≥25%; circunferência da cintura) foram testados via procedimento gráfico de testes (graphical testing procedure), mantendo o erro tipo I global em α = 0,05.
Endpoints secundários adicionais (≥30%, kg, IMC, PA, HbA1c, lipídios) não foram ajustados para multiplicidade — os intervalos de confiança devem ser interpretados como descritivos, não inferenciais. O artigo explicita essa restrição (nota da Tabela 2).
Perguntas 10–11: interpretação da figura/tabela principal e inferência sobre a hipótese nula.
A Figura 1 (Painéis A, B, C) e a Tabela 2 trazem juntas o coração da resposta ao trial.
| Meta | Tirzepatide | Semaglutide | Razão de risco (IC95%) |
|---|---|---|---|
| ≥ 10% | 81,6% (304/374) | 60,5% (227/376) | 1,3 (1,2–1,5) |
| ≥ 15% | 64,6% (241) | 40,1% (151) | 1,6 (1,4–1,9) |
| ≥ 20% | 48,4% (181) | 27,3% (103) | 1,8 (1,5–2,2) |
| ≥ 25% | 31,6% (118) | 16,1% (60) | 2,0 (1,5–2,6) |
| ≥ 30% * | 19,7% (74) | 6,9% (26) | 2,8 (1,9–4,3) |
* ≥30% é endpoint secundário adicional (não ajustado para multiplicidade — interpretar como exploratório).
Sim — a H₀ é rejeitada.
Sob as suposições do modelo, é extremamente improvável (P < 0,001) observar uma diferença de magnitude tão grande ou maior entre tirzepatide e semaglutide se as duas intervenções produzissem, na média, o mesmo efeito ponderal em 72 semanas. Concluímos que tirzepatide produz redução percentual média de peso superior à do semaglutide, com magnitude pontual estimada em 6,5 pontos percentuais (IC95% 4,9–8,1).
Perguntas 12–14: validade interna (metodológica), validade externa (generalização) e inferência sobre a hipótese conceitual.
A hipótese conceitual (Q2) afirmava que o dual-agonismo GIP/GLP-1 é farmacologicamente superior ao monoagonismo GLP-1 em obesidade sem DM2. Os achados do SURMOUNT-5 sustentam essa hipótese:
Em adultos com obesidade sem DM2, a adição do agonismo GIP ao agonismo GLP-1 confere benefício ponderal incremental clinicamente relevante, provavelmente mediado por mecanismos complementares (central + periférico em adipócitos). A diferença não é explicável apenas por variação aleatória ou diferenças de dose-equivalência.
Perguntas 15–18: segurança, significância clínico-farmacológica, NNT e custo da intervenção.
| Variável | Tirzepatide (N=374) | Semaglutide (N=376) |
|---|---|---|
| AEs durante tratamento | 76,7% (287) | 79,0% (297) |
| AEs sérios | 4,8% (18) | 3,5% (13) |
| Mortes | 0 | 0 |
| Descontinuação por AE | 6,1% (23) | 8,0% (30) |
| Descontinuação por AE GI | 2,7% (10) | 5,6% (21) |
O P-valor diz apenas que a diferença observada é improvável sob a H₀. Significância clínica exige outra pergunta: a diferença é grande o suficiente para mudar conduta, melhorar vida, ou justificar custo?
O NNT (number needed to treat) = 1 / ARR (absolute risk reduction). Para uma intervenção benéfica, indica quantos pacientes precisamos tratar (com tirzepatide ao invés de semaglutide) para que 1 paciente adicional atinja a meta.
Para estimar o custo de evitar um desfecho adicional (≥15% de perda) com tirzepatide vs semaglutide, multiplicamos o NNT pelo custo do tratamento por paciente em 72 semanas.
| Fármaco | EUA (lista) | Brasil (privado, dose máx) |
|---|---|---|
| Tirzepatide (Mounjaro / Zepbound) | ~US$ 1.060/mês | ~R$ 1.800–2.500/mês |
| Semaglutide (Wegovy / Ozempic) | ~US$ 1.350/mês | ~R$ 1.100–1.500/mês |
Os valores variam por dose, fonte (Lilly Direct nos EUA tem preço menor para Zepbound; no Brasil há variação por importação direta e farmácia).
Pontos-chave de uma leitura crítica do SURMOUNT-5 — o que defender em mesa redonda e o que questionar.
Em 72 sem, redução média de 20,2% vs 13,7% (Δ −6,5 p.p.; IC95% −8,1 a −4,9; P<0,001). Magnitude clinicamente relevante e robusta a múltiplos estimands.
A cada 5 pacientes tratados com tirzepatide ao invés de semaglutide, 1 a mais atinge perda ≥15% — limiar de remissão de AOS e melhora cardiometabólica.
Randomização e análise sólidas, mas open-label e patrocínio integrado da Eli Lilly são vulnerabilidades reais — não fatais, mas precisam ser declaradas.
76% brancos, EUA-only, exclui DM2 e GLP-1 recente. Custo no Brasil torna a aplicação populacional restrita à minoria com acesso privado.
O desfecho primário é peso (intermediário). Para tirzepatide, a evidência cardiovascular dura virá com o SURMOUNT-MMO (em curso). Para semaglutide, o SELECT já mostrou redução de MACE.
Ambos com AEs GI leves a moderados, sem mortes, sem sinais novos. Tirzepatide teve mais reação no local de injeção; semaglutide, mais vômito e descontinuação por GI.
Para perda ambiciosa (≥15–20%) → tirzepatide. Para perda modesta + DCV estabelecida → semaglutide (com SELECT). Para o SUS → ambos inviáveis no momento; lifestyle estruturado + bariátrica continuam o padrão público.
P-valor não basta. Discutir NNT, IC, multiplicidade, estimands, validade externa, custo-efetividade é parte integral da análise farmacológica moderna — o "flerte" da farmacologia com a epidemiologia é exatamente essa exigência de rigor inferencial.