📄 Artigo (PDF)
Análise Crítica · F3 Simpósio Obesidade · Farmacologia UFRGS

SURMOUNT-5,
decifrado.

Aronne LJ, Horn DB, le Roux CW, et al. Tirzepatide as Compared with Semaglutide for the Treatment of Obesity.
N Engl J Med 2025; 393(1): 26–36. DOI: 10.1056/NEJMoa2416394.
ClinicalTrials.gov: NCT05822830 · Patrocinador: Eli Lilly.

Ficha de leitura crítica em 18 perguntas — desenho, viéses, resultados, NNT e aplicabilidade clínica do primeiro trial cabeça-a-cabeça entre o dual-agonista GIP/GLP-1 e o monoagonista GLP-1 em adultos com obesidade sem diabetes.

Fase
3b
N
751
Duração
72 sem
Δ Peso
−6,5 p.p.
Tirzepatide
GIP + GLP-1 · 10/15 mg sem
vs
Semaglutide
GLP-1 · 1,7/2,4 mg sem
−20,2% vs −13,7%
01 / Contexto

A pergunta clínica.

As perguntas 1–2 da ficha tratam da motivação científica do estudo. Por que o ensaio foi conduzido? Qual a hipótese conceitual?

1
Pergunta 01 da ficha
Qual é a base teórica do assunto investigado?
Pense em:

Doença, tratamentos padrão, farmacodinâmica/farmacocinética dos dois agentes, lacuna de evidência que motivou o trial.

Resposta — análise integrada

A doença. A obesidade é uma doença crônica, recidivante e multifatorial, com prevalência global crescente. No estudo, o IMC médio basal foi 39,4 kg/m² (obesidade grau II–III) e os pacientes acumulavam ~16 anos de obesidade, com 50% apresentando duas ou mais complicações relacionadas. As morbidades atreladas (hipertensão, dislipidemia, apneia obstrutiva do sono — AOS, doença cardiovascular) explicam por que ela é um alvo terapêutico de alto impacto.

Tratamento padrão pré-incretinas. Modificação de estilo de vida (dieta hipocalórica + exercício) produz perdas modestas (5–10%) e baixa sustentabilidade. Cirurgia bariátrica produz perdas robustas (25–30%) mas é invasiva e tem critérios restritivos. Fármacos anteriores (orlistate, naltrexona-bupropiona, fentermina-topiramato) ofereciam perdas de 5–10% com efeitos colaterais limitantes.

Farmacologia dos comparadores.

Tirzepatide

Dual-agonismo GIP/GLP-1

  • Mecanismo: agonista do polipeptídeo insulinotrópico glicose-dependente (GIP) e do GLP-1, em uma única molécula.
  • Receptores de GIP em adipócitos parecem regular metabolismo direto — pré-clínica em Cell Metab sugere efeitos lipocíticos.
  • GLP-1 central: saciedade, retardo gástrico, regulação comportamental alimentar.
  • Farmacocinética: meia-vida ~5 dias, posologia semanal SC.
  • Eficácia prévia: SURMOUNT-1 → −22,9% em ~3,5 anos.
Semaglutide

Monoagonismo GLP-1

  • Mecanismo: agonista seletivo do receptor GLP-1.
  • Central: núcleo arqueado/hipotálamo — supressão de apetite, modulação de recompensa alimentar.
  • Periférico: retardo do esvaziamento gástrico, melhora da insulinossensibilidade.
  • Farmacocinética: meia-vida ~7 dias, posologia semanal SC.
  • Eficácia prévia: STEP 1 → −14,9% em 68 sem; STEP 5 → −16,7% em ~2 anos.

A lacuna que motivou o estudo. Até maio de 2025, nenhum trial cabeça-a-cabeça havia comparado os dois agentes em adultos com obesidade sem diabetes. Comparações indiretas (cross-trial) sugeriam superioridade do tirzepatide, mas eram passíveis de confundimento por diferenças populacionais. Restava equipoise clínico legítimo para uma decisão entre os agentes — o que o trial busca resolver.

Pearl epidemiológico: comparações indiretas (network meta-analyses) só substituem comparação direta quando as populações e desfechos são suficientemente homogêneos. Em SURMOUNT-1 (tirzepatide) e STEP 1 (semaglutide), perfis basais diferiam — daí a necessidade do SURMOUNT-5.
2
Pergunta 02 da ficha
Identifique a hipótese conceitual.
Pense em:

A hipótese conceitual é uma afirmação biológica/farmacológica geral — não confunda com a hipótese estatística (nula).

Resposta

Hipótese conceitual: em adultos com obesidade sem diabetes tipo 2, o dual-agonismo GIP/GLP-1 (tirzepatide) produz redução de peso corporal clinicamente superior à do monoagonismo GLP-1 (semaglutide), por meio de mecanismos farmacológicos complementares — agindo simultaneamente em centros hipotalâmicos do apetite e diretamente em adipócitos via receptor de GIP.

Em termos mais operacionais: "adicionar ação GIP ao agonismo GLP-1 amplifica a magnitude da perda de peso além do que se obtém com GLP-1 isolado".

02 / Desenho

O ensaio em perspectiva.

Perguntas 3–5: delineamento, critérios de seleção, intervenções comparadas.

3
Pergunta 03 da ficha
Qual é o delineamento geral do estudo?
Resposta

Trata-se de um ensaio clínico de fase 3b, multicêntrico, paralelo, randomizado 1:1, controlado e open-label (aberto), conduzido em 32 sítios nos EUA e Porto Rico entre abril de 2023 e novembro de 2024, com seguimento de 72 semanas.

Fase 3b Paralelo 1:1 Randomizado Open-label Multicêntrico (32 sites) 72 semanas

Por que fase 3b? Fase 3 = estudos pivotais que estabelecem eficácia/segurança para registro. O sufixo "b" indica que o trial foi conduzido após a aprovação inicial do fármaco, geralmente para responder questões adicionais (comparações cabeça-a-cabeça, populações novas, doses).

Equipoise e ausência de placebo: a opção por braço ativo (sem placebo) é defensável eticamente — ambos os fármacos já têm eficácia estabelecida, e privar pacientes do tratamento padrão por 72 semanas seria questionável.

Limitação central de desenho: o estudo NÃO é cego (open-label). Tanto participantes quanto investigadores sabiam qual fármaco foi alocado — abre porta para viés de condução e detecção (ver pergunta 8).
4
Pergunta 04 da ficha
Descreva os critérios para seleção dos participantes.
Resposta

Critérios de inclusão

  • Idade ≥ 18 anos
  • IMC ≥ 30 kg/m², OU IMC ≥ 27 kg/m² + pelo menos uma complicação relacionada à obesidade (HAS, dislipidemia, AOS ou DCV)
  • Relato de pelo menos uma tentativa dietética malsucedida para perda de peso

Critérios de exclusão (chave)

  • Diabetes mellitus tipo 2 — exclusão definidora deste trial vs SURMOUNT-2
  • Tratamento cirúrgico prévio ou planejado para obesidade
  • Uso de medicação para perda de peso ou agonista GLP-1 nos últimos 90 dias
  • Mudança de peso > 5 kg nos últimos 90 dias (estabilidade ponderal exigida)

Estratificação da randomização

Estratificada por IMC basal (< 35 vs ≥ 35), sexo, e status de pré-diabetes (definido por testes laboratoriais em jejum no screening).

Significado da estratificação: balanceia covariáveis fortemente associadas ao desfecho (resposta à perda de peso difere por sexo, IMC inicial e disglicemia). Reduz risco de desequilíbrio por acaso entre os braços.

Características basais (Tabela 1 do artigo)

Idade média
44,7
anos (DP 12,8)
Sexo feminino
64,7%
485 / 750
Peso médio
113,0
kg (DP 25,6)
IMC médio
39,4
kg/m² (DP 7,6)
Cintura
118,3
cm (DP 16,9)
Pré-diabetes
56,7%
425 / 750
≥2 complicações
50,1%
376 / 750
Duração obesidade
16
anos (DP 11,3)

Distribuição racial/étnica: 76,1% brancos, 19,2% negros, 2,4% asiáticos, 26,1% Hispanic/Latino — diversidade etnoracial relativamente boa para um trial NEJM, mas com sub-representação populacional global (especialmente Sul Global, Ásia oriental, indígenas).

5
Pergunta 05 da ficha
Caracterize as intervenções (ou exposições) estudadas.
Resposta

Ambos os fármacos foram administrados subcutâneos, uma vez por semana, por 72 semanas, em dose máxima tolerada — esquema de escalonamento progressivo.

Esquema de tirzepatide (braço de intervenção)

  • Início: 2,5 mg/semana
  • Aumento de 2,5 mg a cada 4 semanas
  • Alvo: 10 mg ou 15 mg (a dose máxima tolerada que o paciente conseguir manter)
  • Resultado: 89,3% receberam pelo menos uma dose de 15 mg

Esquema de semaglutide (comparador)

  • Início: 0,25 mg/semana
  • Escalonamento mensal: 0,5 → 1,0 → 1,7 → 2,4 mg
  • Alvo: 2,4 mg (ou manter em 1,7 mg se efeitos adversos limitarem) — protocolo idêntico ao STEP 1
  • Resultado: 92,8% receberam pelo menos uma dose de 2,4 mg

Manejo conjunto

  • Aconselhamento de dieta e atividade física em ambos os braços
  • Possibilidade de até 2 ciclos de descida-reescalada de dose se intolerância
  • Se IMC caísse para 22 → ajustar dose ou ingestão calórica para evitar emagrecimento excessivo
  • Quem não tolerasse permanecia em follow-up (estimand modificado captura este efeito)
Atenção crítica: a comparação é entre doses máximas toleradas, não doses fixas. Em tese, comparar dois fármacos no "teto" terapêutico de cada um é defensável (cabeça-a-cabeça verdadeiro). Mas isso impede inferência sobre comparações de doses sub-máximas (e.g., tirzepatide 5 mg vs semaglutide 2,4 mg) — comuns na prática.
03 / Métodos

Desfechos, hipóteses, viéses.

Perguntas 6–9: o que foi medido, como, qual a hipótese nula, e como os autores se protegeram de erros sistemáticos e aleatórios.

6
Pergunta 06 da ficha
Identifique o desfecho primário e como foi avaliado. Classifique a importância.
Resposta

Desfecho primário: mudança percentual no peso corporal da linha de base à semana 72.

Como foi medido: peso aferido em consulta presencial, comparado ao basal. A estimativa central usou um modelo de análise de covariância (ANCOVA) com tratamento, fatores de estratificação (pré-diabetes, sexo, IMC) e valor basal como covariáveis.

Desfechos secundários-chave (também ajustados para multiplicidade):

  • Proporção atingindo redução ≥ 10%, 15%, 20% e 25% do peso
  • Mudança absoluta na circunferência da cintura

Desfechos secundários adicionais (sem ajuste de multiplicidade): redução ≥30%, mudança em kg, mudança em IMC, pressão arterial, HbA1c, glicemia de jejum, lipídios, eventos adversos.

Classificação de importância — análise crítica

Classificação justificada: (2) IMPORTANTE, mas não totalmente crítico.

Peso e composição corporal são alvos diretos da intervenção e fortemente associados a melhora cardiometabólica. Porém, peso é um desfecho intermediário (surrogate) — o desfecho clinicamente "duro" final seria redução de eventos cardiovasculares maiores (MACE), mortalidade ou remissão de comorbidades (e.g., AOS, DM2).

O SELECT trial (semaglutide) já demonstrou redução de MACE com semaglutide. Para tirzepatide, o SURMOUNT-MMO (em curso) responderá essa pergunta. Até lá, a inferência aqui é sobre eficácia ponderal, não sobre desfechos duros.

Hierarquia GRADE simplificada: (1) pouco importante — biomarcadores isolados sem ligação clínica; (2) importante — surrogates validados; (3) crítico — mortalidade, MACE, qualidade de vida medida.
7
Pergunta 07 da ficha
Qual é a hipótese nula? (escreva no formato PICO + quantificação)
Resposta — PICO completo
P
População

Adultos ≥ 18 anos com obesidade (IMC ≥30, ou ≥27 com pelo menos uma complicação relacionada) sem diabetes, com tentativa dietética malsucedida prévia.

I
Intervenção

Tirzepatide SC, 1×/semana, em dose máxima tolerada (10 mg ou 15 mg), por 72 semanas.

C
Comparador

Semaglutide SC, 1×/semana, em dose máxima tolerada (1,7 mg ou 2,4 mg), por 72 semanas.

O
Outcome (desfecho)

Mudança percentual média no peso corporal da linha de base à semana 72 — medida de associação: diferença de médias entre grupos (em pontos percentuais).

H₀ (hipótese nula):

"Em adultos com obesidade sem diabetes, não há diferença na variação percentual média do peso corporal em 72 semanas entre tirzepatide (10 ou 15 mg/sem) e semaglutide (1,7 ou 2,4 mg/sem) — ou seja, a diferença entre médias é igual a zero."

Formalmente: μtirzepatide − μsemaglutide = 0

H₁ (alternativa bilateral):

"Existe diferença entre as duas intervenções na variação percentual de peso (μtirzepatide − μsemaglutide ≠ 0)."

Os autores planejaram o estudo para detectar uma diferença de 3 pontos percentuais, embora o teste seja bilateral (não pré-especifica direção).

Por que diferença de médias (e não risco relativo) para o primário? O desfecho primário é uma variável contínua (% de mudança de peso). Para os secundários binários (≥10%, ≥15%...) o trial calculou razão de risco (RR) via G-computation sobre regressão logística — formalismo apropriado para desfechos dicotômicos.
8
Pergunta 08 da ficha
Analise os fatores que podem diminuir a qualidade do estudo (viéses).
Resposta — análise sistemática por domínio (Cochrane RoB 2)
1. Geração da sequência de alocação
Baixo risco

Randomização computacional via sistema interativo de resposta web (IWRS), com estratificação por IMC, sexo e pré-diabetes. Procedimento adequado.

2. Sigilo da alocação
Baixo risco

Sistema centralizado eletrônico (IWRS) — investigadores não tinham acesso prévio à sequência. Procedimento adequado.

3. Viés de condução (performance)
Alto risco

Open-label. Pacientes e equipe sabiam o fármaco. Pode influenciar adesão, comportamento alimentar, motivação, expectativa de eficácia. Tirzepatide é o "produto novo e mais discutido na mídia" — possível efeito de expectativa.

4. Viés de detecção
Risco moderado

Peso e cintura são desfechos objetivos (mensurações em balança/fita) — risco menor. Mas eventos adversos (náusea, fadiga, reação local) dependem de relato subjetivo. Em open-label, há viés de notificação assimétrico.

5. Viés de atrito
Baixo risco

Descontinuação: 14,9% (tirz) vs 19,8% (sema) — assimétrica mas razoável. Estimand modificado tratou descontinuação como evento. Múltipla imputação via regras de Rubin.

6. Relato seletivo
Baixo risco

Protocolo registrado em clinicaltrials.gov (NCT05822830) e publicado no NEJM como suplemento. Todos os endpoints declarados foram reportados.

7. Conflito de interesse / patrocínio
Alto risco

Eli Lilly (fabricante do tirzepatide) desenhou o estudo, fez monitoramento, coletou e analisou os dados. Autores principais (primeiro e último) escreveram o manuscrito. Acordos de confidencialidade. Viés do patrocinador é um fator real e bem documentado na literatura em ensaios industriais.

8. Generalização (validade externa)
Moderado

76% brancos, 65% mulheres, populacionalmente concentrado em EUA. Exclui DM, cirurgia prévia, GLP-1 recente. Aplicabilidade ao Brasil/SUS é limitada (ver Q13).

Veredito de viés: as duas grandes vulnerabilidades são o desenho open-label e o patrocínio industrial integrado. Os autores reconhecem o open-label e argumentam que a consistência com trials anteriores (cegos) sustenta a generalizabilidade — argumento legítimo mas não eliminador do viés.
9
Pergunta 09 da ficha
Como se procedeu para controle de erros aleatórios?
Resposta — planejamento estatístico

Cálculo amostral (planejamento)

  • α (erro tipo I): 0,05 bilateral
  • Poder (1 − β): 90%
  • Δ esperado: diferença de 3 pontos percentuais entre grupos
  • DP assumido: 12%
  • Descontinuação esperada: 20% (na realidade ficou em ~18% global)
  • N planejado: 700 (350 por braço); recrutaram 751
  • Teste: dois-amostral t de duas caudas
Cálculo de poder bem feito é raro: os autores especificaram poder, α, Δ, DP antes de iniciar o trial e recrutaram 7% acima do mínimo — proteção contra perda amostral inesperada.

Controle de comparações múltiplas

Endpoints primário e secundários-chave (≥10%, ≥15%, ≥20%, ≥25%; circunferência da cintura) foram testados via procedimento gráfico de testes (graphical testing procedure), mantendo o erro tipo I global em α = 0,05.

Endpoints secundários adicionais (≥30%, kg, IMC, PA, HbA1c, lipídios) não foram ajustados para multiplicidade — os intervalos de confiança devem ser interpretados como descritivos, não inferenciais. O artigo explicita essa restrição (nota da Tabela 2).

Intervalos de confiança

  • IC 95% reportados para todas as estimativas de mudança de peso, cintura, RR de atingimento de metas, mudança de PA, etc.
  • Para o desfecho primário: IC95% da diferença = (−8,1 a −4,9). Não inclui zero → consistente com rejeição de H₀.

Análises de sensibilidade

  • Estimand modificado de regime-de-tratamento (primário): contabiliza descontinuação prematura ou início de medicação concomitante. Mais conservador.
  • Estimand de eficácia (sensibilidade): avalia "se completasse o tratamento, o que aconteceria?". Resultado: tirz −22,8 kg vs sema −15,0 kg (mais favorável ao tirzepatide).
Veredito estatístico: planejamento amostral robusto, controle adequado de multiplicidade nos endpoints principais, IC bem reportados, dois estimands complementares. O controle de erros aleatórios é tecnicamente sólido.
04 / Resultados

Os dados, em foco.

Perguntas 10–11: interpretação da figura/tabela principal e inferência sobre a hipótese nula.

10
Pergunta 10 da ficha
Identifique e interprete a principal tabela/figura produzida em função da hipótese nula.
Resposta — Figura 1 + Tabela 2

A Figura 1 (Painéis A, B, C) e a Tabela 2 trazem juntas o coração da resposta ao trial.

Painel A — mudança percentual média de peso

Tirzepatide
−20,2%
IC95% −21,4 a −19,1
Semaglutide
−13,7%
IC95% −14,9 a −12,6
Diferença
−6,5
p.p. · IC95% −8,1 a −4,9 · P<0,001

Painel B — proporção que atingiu metas pré-definidas (RR)

MetaTirzepatideSemaglutideRazão de risco (IC95%)
≥ 10%81,6% (304/374)60,5% (227/376)1,3 (1,2–1,5)
≥ 15%64,6% (241)40,1% (151)1,6 (1,4–1,9)
≥ 20%48,4% (181)27,3% (103)1,8 (1,5–2,2)
≥ 25%31,6% (118)16,1% (60)2,0 (1,5–2,6)
≥ 30% *19,7% (74)6,9% (26)2,8 (1,9–4,3)

* ≥30% é endpoint secundário adicional (não ajustado para multiplicidade — interpretar como exploratório).

Painel C — mudança em cintura

Tirzepatide
−18,4 cm
IC95% −19,6 a −17,2
Semaglutide
−13,0 cm
IC95% −14,3 a −11,7
Diferença
−5,4 cm
IC95% −7,1 a −3,6 · P<0,001

Interpretação integrada

  • A magnitude da diferença (6,5 p.p.) é clinicamente relevante, não apenas estatisticamente significativa.
  • A relação dose-resposta de "número que atinge meta" é consistente em todas as faixas (≥10% até ≥30%) — coerência interna que reforça a credibilidade.
  • A diferença na cintura (5,4 cm) excede o limiar de 4 cm associado a redução de mortalidade em meta-análises populacionais.
  • Quanto maior a meta, maior o RR — passa de 1,3 (≥10%) para 2,8 (≥30%). O tirzepatide brilha mais nos extremos superiores de perda.
11
Pergunta 11 da ficha
Os resultados permitem inferir sobre a hipótese nula? Se sim, qual a inferência adequada?
Resposta

Sim — a H₀ é rejeitada.

  • P < 0,001 para o desfecho primário
  • IC 95% da diferença (−8,1 a −4,9) não contém o zero
  • O resultado é robusto a ambos os estimands (modificado e de eficácia)
  • Consistência entre desfechos primário, secundários e exploratórios
Inferência adequada:

Sob as suposições do modelo, é extremamente improvável (P < 0,001) observar uma diferença de magnitude tão grande ou maior entre tirzepatide e semaglutide se as duas intervenções produzissem, na média, o mesmo efeito ponderal em 72 semanas. Concluímos que tirzepatide produz redução percentual média de peso superior à do semaglutide, com magnitude pontual estimada em 6,5 pontos percentuais (IC95% 4,9–8,1).

Inferências que NÃO se justificam diretamente do P-valor:
  • "Tirzepatide é melhor para reduzir mortalidade" — não testado neste estudo
  • "A diferença de 6,5 p.p. é clinicamente importante para todo paciente" — depende da meta individual e perfil de risco
  • "O efeito persistirá além de 72 semanas" — não há dados além desse horizonte aqui
  • "Tirzepatide é superior ao semaglutide em doses sub-máximas" — só dose máxima foi comparada
05 / Validade

Quanto vale o que se conclui.

Perguntas 12–14: validade interna (metodológica), validade externa (generalização) e inferência sobre a hipótese conceitual.

12
Pergunta 12 da ficha
O trabalho tem validade interna? Metodologicamente é um estudo adequado com baixo risco de viés?
Resposta — síntese da Q8

✓ Pontos fortes

  • Randomização adequada (IWRS, estratificada)
  • Sigilo de alocação preservado
  • Tamanho amostral planejado com poder 90%
  • Estratificação por covariáveis relevantes (IMC, sexo, pré-diabetes)
  • Estimand pré-especificado e conservador (modificado)
  • Controle de multiplicidade com testing graphical procedure
  • Análise de sensibilidade com estimand alternativo (eficácia)
  • Relato completo (CONSORT) e protocolo público
  • Desfechos primário e secundários objetivos (peso, cintura)

✗ Limitações metodológicas

  • Open-label — risco real de viés de condução
  • Patrocínio integrado pela Eli Lilly (desenho, coleta, análise) — viés do patrocinador
  • Ausência de braço placebo (defensável eticamente)
  • Eventos adversos com componente subjetivo afetados pelo não-cegamento
  • Comparação apenas em dose máxima tolerada — não cobre regimes mais baixos comuns na prática
  • Horizonte de 72 semanas — sustentação de longo prazo desconhecida
Veredito sobre validade interna: moderada a alta. O estudo é metodologicamente sólido nos aspectos estruturais (randomização, sigilo, cálculo amostral, análise) mas tem duas vulnerabilidades reais — open-label e patrocínio industrial — que reduzem o nível de confiança máxima que se pode atribuir aos achados isoladamente.
Atenuante importante: os efeitos pontuais observados aqui são consistentes com o que trials cegos (SURMOUNT-1, STEP 1, e comparações indiretas em JAMA 2024) já haviam sinalizado. A coerência externa aumenta a confiança apesar do open-label.
13
Pergunta 13 da ficha
O trabalho tem validade externa? Quanto a população do estudo reflete a realidade da prática clínica brasileira?
Resposta — análise contextual UFRGS/SUS

Aspectos favoráveis à generalização

  • População diversificada dentro do contexto americano: 19% pretos, 26% Hispanic/Latino — diversidade melhor que o usual em trials NEJM
  • 35% de homens (mais do que os trials STEP, que tinham 19–26% homens) — reflete um espectro de gênero mais equilibrado
  • 50% com ≥2 complicações da obesidade — perfil clínico realista (não "saudáveis fora a obesidade")
  • Esquema posológico ajustado individualmente (dose máxima tolerada) — espelha a prática real, não apenas dose-fixa
  • 32 sites — heterogeneidade de centro

Aspectos que limitam a generalização ao Brasil

  • População exclusivamente EUA+Porto Rico — não inclui Brasil, América Latina (Hispanic ≠ Brasil), África, Ásia.
  • 76% brancos — proporção muito maior do que a brasileira (~43% brancos pelo IBGE).
  • Exclusão de diabetes — no Brasil, prevalência de DM2 + obesidade combinadas é alta; muitos pacientes da prática real são excluídos.
  • Exclusão de uso recente de GLP-1 — paciente real frequentemente já tentou outros agentes.
  • Acesso ao tirzepatide: aprovado pela ANVISA, mas custo no Brasil ~R$ 1.500–2.500/mês (varia por dose, plataforma e dose semanal). SUS não oferece; planos de saúde têm cobertura limitada (geralmente apenas DM2). Acesso real à intervenção é restrito a uma minoria com poder de compra.
  • Aconselhamento dietético estruturado e acesso a centros especializados — o contexto americano de cuidado é mais intensivo que o disponível no SUS.
Veredito sobre validade externa: baixa-a-moderada para o contexto SUS brasileiro, moderada para a prática privada brasileira. A magnitude de eficácia provavelmente se mantém em populações brasileiras (não há razão biológica para diferença), mas a aplicabilidade é fortemente limitada por barreira financeira — o impacto populacional do achado depende mais de política de acesso do que da farmacologia em si.
Epidemiologia aplicada: trial com eficácia robusta mas baixa cobertura populacional → impacto agregado depende do número de pacientes tratáveis × NNT. Para o Brasil, o número de pacientes com acesso real ao tirzepatide é uma fração pequena do denominador de obesidade.
14
Pergunta 14 da ficha
Qual é a inferência sobre a hipótese conceitual?
Resposta

A hipótese conceitual (Q2) afirmava que o dual-agonismo GIP/GLP-1 é farmacologicamente superior ao monoagonismo GLP-1 em obesidade sem DM2. Os achados do SURMOUNT-5 sustentam essa hipótese:

  • Magnitude da diferença (6,5 p.p.) é consistente com mecanismo aditivo/sinérgico
  • Efeito é maior em metas elevadas (RR cresce de 1,3 para 2,8 quando passamos de ≥10% para ≥30%) — sugere componente farmacológico adicional, não apenas variação
  • Mudança em cintura também maior — coerente com hipótese de ação direta em adipócitos via receptor GIP
  • Coerência com modelos pré-clínicos (Samms et al., J Clin Invest 2021; Regmi et al., Cell Metab 2024) que demonstraram regulação direta de nutrientes em adipócitos via GIP
Inferência conceitual fundamentada:

Em adultos com obesidade sem DM2, a adição do agonismo GIP ao agonismo GLP-1 confere benefício ponderal incremental clinicamente relevante, provavelmente mediado por mecanismos complementares (central + periférico em adipócitos). A diferença não é explicável apenas por variação aleatória ou diferenças de dose-equivalência.

Limites da inferência conceitual:
  • Não testa se o efeito é GIP-específico ou se outras moléculas duais (e.g., retatrutida — GIP/GLP-1/glucagon) teriam o mesmo efeito
  • Não esclarece se a sinergia é farmacodinâmica ou farmacocinética
  • Não testa em DM2 (onde a fisiopatologia é diferente — incretina reduzida)
06 / Aplicabilidade Clínica

Da estatística para a cabeceira.

Perguntas 15–18: segurança, significância clínico-farmacológica, NNT e custo da intervenção.

15
Pergunta 15 da ficha
Qual a segurança da intervenção proposta?
Resposta — Tabela 3 do artigo

Perfil geral de eventos adversos

VariávelTirzepatide (N=374)Semaglutide (N=376)
AEs durante tratamento76,7% (287)79,0% (297)
AEs sérios4,8% (18)3,5% (13)
Mortes00
Descontinuação por AE6,1% (23)8,0% (30)
Descontinuação por AE GI2,7% (10)5,6% (21)

Eventos GI (mais comuns, predominantemente leves a moderados)

  • Náusea: 43,6% (tirz) vs 44,4% (sema) — equivalente
  • Constipação: 27,0% vs 28,5%
  • Diarreia: 23,5% vs 23,4%
  • Vômito: 15,0% vs 21,3% — menor com tirzepatide

Outros eventos de interesse

  • Reação no local de injeção: 8,6% (tirz) vs 0,3% (sema) — maior com tirzepatide — característica de formulação
  • Alopecia: 8,3% vs 6,1% — sintoma frequentemente associado a perda de peso rápida (mecanismo não-fármaco-específico)
  • Pancreatite: 0 vs 1 caso (adjudicado, semaglutide)
  • Carcinoma medular de tireoide: 0 em ambos os braços
  • Eventos cardiovasculares maiores: nenhum adjudicado em ambos
Perfil de segurança geral: Ambos os fármacos com perfil de segurança consistente com trials anteriores (SURMOUNT, STEP). Eventos GI são esperados de classe incretina e ocorrem majoritariamente durante o escalonamento de dose, sendo leves a moderados. O tirzepatide teve numericamente menos descontinuações por intolerância GI mas mais reações de injeção.
Limitações da avaliação de segurança:
  • 72 semanas é horizonte curto para detectar eventos raros (pancreatite, neoplasias)
  • Estudo open-label → viés de notificação possível
  • Excluiu DM2 — pacientes mais frágeis (alto risco cardiovascular, polimedicados) não testados
16
Pergunta 16 da ficha
Os resultados têm significância farmacológico-clínica? Qual é a sua aplicabilidade?
Resposta — significância além do "P < 0,05"

Estatística vs clínica

O P-valor diz apenas que a diferença observada é improvável sob a H₀. Significância clínica exige outra pergunta: a diferença é grande o suficiente para mudar conduta, melhorar vida, ou justificar custo?

A diferença de 6,5 p.p. é clinicamente relevante?

  • Limiar de remissão de AOS: ~7–11% de perda. Mais pacientes com tirzepatide cruzam esse limiar.
  • Limiar de remissão de DM2 precoce: 10–15%. Mais pacientes com tirzepatide.
  • Limiar associado a redução de eventos CV (extrapolando SELECT): ≥5% confere benefício, mas magnitudes maiores parecem benéficas em proporção.
  • Pressão arterial: tirzepatide reduziu PAS em −10,2 mmHg vs −7,7 mmHg com semaglutide. Diferença de 2,5 mmHg em PAS população-nível associa-se a redução notável de eventos CV em meta-análises.
  • Cintura −5,4 cm a mais: uma meta-análise mostrou aumento de 7–9% de mortalidade por cada 5 cm adicional de cintura. A redução incremental potencialmente mitiga risco.
Significância clínica: SIM, é clinicamente significativa. A diferença não é "estatística trivial" — afeta proporção de pacientes que atingem metas terapêuticas relevantes (remissão de comorbidades, redução de risco CV).

Aplicabilidade ao paciente real

  • Paciente que busca perda modesta (5–10%): diferença entre os agentes é proporcionalmente menor; semaglutide é alternativa razoável, especialmente considerando custo.
  • Paciente que busca perda ≥ 15% (e.g., para remissão de AOS, DM2 incipiente): tirzepatide tem probabilidade 1,6× maior de atingir a meta. Tirzepatide é primeira escolha, se disponível.
  • Paciente que tolera mal injeção: semaglutide tem reação local muito menor.
  • Paciente com história de vômitos prévios / intolerância GI severa: tirzepatide pode ser melhor (menor descontinuação por GI).
  • Paciente com DCV estabelecida: hoje, semaglutide tem evidência CV (SELECT). Tirzepatide aguarda SURMOUNT-MMO.
17
Pergunta 17 da ficha
Quantos desfechos poderão ser evitados com a intervenção? Calcule o NNT.
Resposta — cálculos passo-a-passo

O NNT (number needed to treat) = 1 / ARR (absolute risk reduction). Para uma intervenção benéfica, indica quantos pacientes precisamos tratar (com tirzepatide ao invés de semaglutide) para que 1 paciente adicional atinja a meta.

NNT para metas de perda de peso (SURMOUNT-5)
Tirzepatide vs Semaglutide · 72 sem · obesidade sem DM2
Meta ≥ 10%
NNT ≈ 5
ARR = 81,6% − 60,5% = 21,1%
A cada 5 pacientes tratados com tirzepatide ao invés de semaglutide, 1 adicional atinge ≥10% de perda.
Meta ≥ 15%
NNT ≈ 5
ARR = 64,6% − 40,1% = 24,5%
1 paciente adicional atinge ≥15% — limiar de remissão de AOS e melhora cardiometabólica.
Meta ≥ 20%
NNT ≈ 5
ARR = 48,4% − 27,3% = 21,1%
1 paciente adicional atinge ≥20% — limiar próximo do efeito bariátrico para muitos casos.
Meta ≥ 25%
NNT ≈ 7
ARR = 31,6% − 16,1% = 15,5%
1 paciente adicional atinge perda muito alta (≥25%) — análoga à perda bariátrica.
Meta ≥ 30%
NNT ≈ 8
ARR = 19,7% − 6,9% = 12,8%
Meta exploratória sem ajuste de multiplicidade — interpretar como tendência.
Interpretação clínica do NNT ≈ 5: em uma faixa de NNT 5–8 a intervenção é considerada de alto impacto clínico em farmacoterapia preventiva. Para comparação: estatinas em prevenção primária têm NNT de ~50–100 para evitar 1 evento CV em 5 anos; metformina em prediabetes tem NNT ~7 para evitar 1 caso de DM em 3 anos. O NNT do tirzepatide para metas ponderais ambiciosas é excelente — mas o "desfecho" aqui é metabólico/intermediário, não duro.
18
Pergunta 18 da ficha
Quanto custa para prevenir um desfecho?
Resposta — análise farmacoeconômica

Para estimar o custo de evitar um desfecho adicional (≥15% de perda) com tirzepatide vs semaglutide, multiplicamos o NNT pelo custo do tratamento por paciente em 72 semanas.

Premissas de preço (estimativas referenciais, maio/2025)

FármacoEUA (lista)Brasil (privado, dose máx)
Tirzepatide (Mounjaro / Zepbound)~US$ 1.060/mês~R$ 1.800–2.500/mês
Semaglutide (Wegovy / Ozempic)~US$ 1.350/mês~R$ 1.100–1.500/mês

Os valores variam por dose, fonte (Lilly Direct nos EUA tem preço menor para Zepbound; no Brasil há variação por importação direta e farmácia).

Cenário EUA — custo por desfecho ≥15% prevenido

  • Custo de 72 sem (~16,6 meses) por paciente:
    • Tirzepatide: 16,6 × US$ 1.060 ≈ US$ 17.600
    • Semaglutide: 16,6 × US$ 1.350 ≈ US$ 22.400
  • NNT 5 (≥15%): tratar 5 pacientes com tirz ao invés de sema =
    • Custo total tirz: 5 × US$ 17.600 ≈ US$ 88.000
    • Custo total sema: 5 × US$ 22.400 ≈ US$ 112.000
    • Economia de US$ 24.000 + 1 desfecho ≥15% adicional → tirzepatide domina (mais eficaz e mais barato no preço de lista EUA)

Cenário Brasil — análise mais realista

  • Custo de 72 sem por paciente:
    • Tirzepatide: 16,6 × R$ 2.000 ≈ R$ 33.000 (estimativa intermediária)
    • Semaglutide: 16,6 × R$ 1.300 ≈ R$ 21.600
    • Custo incremental: R$ 11.400 por paciente
  • NNT 5 (≥15%): custo incremental por desfecho adicional ≈ 5 × R$ 11.400 = R$ 57.000
  • NNT 7 (≥25%): 7 × R$ 11.400 = R$ 80.000 para 1 desfecho extra de perda muito alta
  • NNT 5 (perda absoluta de 5,4 cm em cintura): implícito — todo paciente em tirzepatide perde +5,4 cm a mais; "NNT" não se aplica diretamente (variável contínua)
Veredito farmacoeconômico para o Brasil: R$ 57.000 por desfecho adicional de ≥15% é caro em termos absolutos, mas precisa ser confrontado com o custo evitado de comorbidades (internações por DM2 descompensado, eventos CV, cirurgia bariátrica, CPAP de longo prazo etc.). Estudos formais de custo-efetividade serão necessários — o ICUR (incremental cost-utility ratio) provavelmente ficará acima dos R$ 30.000/QALY que o REBRATS sugere como threshold de custo-efetivo no SUS.
Limitações da análise: não considera custo de comorbidades evitadas, descontos comerciais, adesão de longo prazo, e o fato de que a maioria dos pacientes provavelmente requererá tratamento crônico — não apenas as 72 semanas do trial. O custo lifetime tende a ser muito maior que o estimado aqui.
Pearl epidemiológico final: mesmo um NNT pequeno (5) não garante custo-efetividade se o preço unitário do fármaco for muito alto. A equação completa é NNT × preço incremental ≤ valor monetário do desfecho evitado. No Brasil, essa equação ainda não fecha favorável ao tirzepatide para a maioria dos pacientes via SUS.
07 / Síntese crítica

O que levar.

Pontos-chave de uma leitura crítica do SURMOUNT-5 — o que defender em mesa redonda e o que questionar.

1

Tirzepatide é superior em magnitude de perda

Em 72 sem, redução média de 20,2% vs 13,7% (Δ −6,5 p.p.; IC95% −8,1 a −4,9; P<0,001). Magnitude clinicamente relevante e robusta a múltiplos estimands.

2

NNT 5 para perda ≥15%

A cada 5 pacientes tratados com tirzepatide ao invés de semaglutide, 1 a mais atinge perda ≥15% — limiar de remissão de AOS e melhora cardiometabólica.

3

Validade interna boa, com 2 ressalvas

Randomização e análise sólidas, mas open-label e patrocínio integrado da Eli Lilly são vulnerabilidades reais — não fatais, mas precisam ser declaradas.

4

Validade externa limitada no SUS

76% brancos, EUA-only, exclui DM2 e GLP-1 recente. Custo no Brasil torna a aplicação populacional restrita à minoria com acesso privado.

5

Sem dados de mortalidade ou MACE

O desfecho primário é peso (intermediário). Para tirzepatide, a evidência cardiovascular dura virá com o SURMOUNT-MMO (em curso). Para semaglutide, o SELECT já mostrou redução de MACE.

6

Seguranças similares; segurança não é o diferencial

Ambos com AEs GI leves a moderados, sem mortes, sem sinais novos. Tirzepatide teve mais reação no local de injeção; semaglutide, mais vômito e descontinuação por GI.

7

A pergunta não é "qual é melhor?", mas "para qual paciente?"

Para perda ambiciosa (≥15–20%) → tirzepatide. Para perda modesta + DCV estabelecida → semaglutide (com SELECT). Para o SUS → ambos inviáveis no momento; lifestyle estruturado + bariátrica continuam o padrão público.

8

A epidemiologia importa

P-valor não basta. Discutir NNT, IC, multiplicidade, estimands, validade externa, custo-efetividade é parte integral da análise farmacológica moderna — o "flerte" da farmacologia com a epidemiologia é exatamente essa exigência de rigor inferencial.

Como defender este artigo em mesa redonda da UFRGS:
  • Reconheça que tirzepatide é superior em magnitude de perda — é a evidência mais limpa que existe hoje (Q1, Q10, Q11).
  • Insista que o desfecho é intermediário — peso, não MACE/mortalidade (Q6).
  • Identifique o open-label como a maior fraqueza metodológica e o patrocínio como contexto importante (Q8, Q12).
  • Quantifique o ganho clínico via NNT 5 para ≥15% — número compreensível e útil para shared decision-making (Q17).
  • Termine com a questão de acesso/custo — no contexto UFRGS/SUS, eficácia ≠ aplicabilidade populacional (Q13, Q18).