Análise Crítica · SURMOUNT-5 · Tirzepatide vs Semaglutide

01 / Contexto

A pergunta clínica.

As perguntas 1–2 da ficha tratam da motivação científica do estudo. Por que o ensaio foi conduzido? Qual a hipótese conceitual?

Pergunta 01 da ficha

Qual é a base teórica do assunto investigado?

Pense em:

Doença, tratamentos padrão, farmacodinâmica/farmacocinética dos dois agentes, lacuna de evidência que motivou o trial.

Resposta — análise integrada

A doença. A obesidade é uma doença crônica, recidivante e multifatorial, com prevalência global crescente. No estudo, o IMC médio basal foi 39,4 kg/m² (obesidade grau II–III) e os pacientes acumulavam ~16 anos de obesidade, com 50% apresentando duas ou mais complicações relacionadas. As morbidades atreladas (hipertensão, dislipidemia, apneia obstrutiva do sono — AOS, doença cardiovascular) explicam por que ela é um alvo terapêutico de alto impacto.

Tratamento padrão pré-incretinas. Modificação de estilo de vida (dieta hipocalórica + exercício) produz perdas modestas (5–10%) e baixa sustentabilidade. Cirurgia bariátrica produz perdas robustas (25–30%) mas é invasiva e tem critérios restritivos. Fármacos anteriores (orlistate, naltrexona-bupropiona, fentermina-topiramato) ofereciam perdas de 5–10% com efeitos colaterais limitantes.

Farmacologia dos comparadores.

Tirzepatide

Dual-agonismo GIP/GLP-1

Mecanismo: agonista do polipeptídeo insulinotrópico glicose-dependente (GIP) e do GLP-1, em uma única molécula.
Receptores de GIP em adipócitos parecem regular metabolismo direto — pré-clínica em Cell Metab sugere efeitos lipocíticos.
GLP-1 central: saciedade, retardo gástrico, regulação comportamental alimentar.
Farmacocinética: meia-vida ~5 dias, posologia semanal SC.
Eficácia prévia: SURMOUNT-1 → −22,9% em ~3,5 anos.

Semaglutide

Monoagonismo GLP-1

Mecanismo: agonista seletivo do receptor GLP-1.
Central: núcleo arqueado/hipotálamo — supressão de apetite, modulação de recompensa alimentar.
Periférico: retardo do esvaziamento gástrico, melhora da insulinossensibilidade.
Farmacocinética: meia-vida ~7 dias, posologia semanal SC.
Eficácia prévia: STEP 1 → −14,9% em 68 sem; STEP 5 → −16,7% em ~2 anos.

A lacuna que motivou o estudo. Até maio de 2025, nenhum trial cabeça-a-cabeça havia comparado os dois agentes em adultos com obesidade sem diabetes. Comparações indiretas (cross-trial) sugeriam superioridade do tirzepatide, mas eram passíveis de confundimento por diferenças populacionais. Restava equipoise clínico legítimo para uma decisão entre os agentes — o que o trial busca resolver.

Pearl epidemiológico: comparações indiretas (network meta-analyses) só substituem comparação direta quando as populações e desfechos são suficientemente homogêneos. Em SURMOUNT-1 (tirzepatide) e STEP 1 (semaglutide), perfis basais diferiam — daí a necessidade do SURMOUNT-5.

Pergunta 02 da ficha

Identifique a hipótese conceitual.

Pense em:

A hipótese conceitual é uma afirmação biológica/farmacológica geral — não confunda com a hipótese estatística (nula).

Resposta

Hipótese conceitual: em adultos com obesidade sem diabetes tipo 2, o dual-agonismo GIP/GLP-1 (tirzepatide) produz redução de peso corporal clinicamente superior à do monoagonismo GLP-1 (semaglutide), por meio de mecanismos farmacológicos complementares — agindo simultaneamente em centros hipotalâmicos do apetite e diretamente em adipócitos via receptor de GIP.

Em termos mais operacionais: "adicionar ação GIP ao agonismo GLP-1 amplifica a magnitude da perda de peso além do que se obtém com GLP-1 isolado".

02 / Desenho

O ensaio em perspectiva.

Perguntas 3–5: delineamento, critérios de seleção, intervenções comparadas.

Pergunta 03 da ficha

Qual é o delineamento geral do estudo?

Resposta

Trata-se de um ensaio clínico de fase 3b, multicêntrico, paralelo, randomizado 1:1, controlado e open-label (aberto), conduzido em 32 sítios nos EUA e Porto Rico entre abril de 2023 e novembro de 2024, com seguimento de 72 semanas.

Fase 3b Paralelo 1:1 Randomizado Open-label Multicêntrico (32 sites) 72 semanas

Por que fase 3b? Fase 3 = estudos pivotais que estabelecem eficácia/segurança para registro. O sufixo "b" indica que o trial foi conduzido após a aprovação inicial do fármaco, geralmente para responder questões adicionais (comparações cabeça-a-cabeça, populações novas, doses).

Equipoise e ausência de placebo: a opção por braço ativo (sem placebo) é defensável eticamente — ambos os fármacos já têm eficácia estabelecida, e privar pacientes do tratamento padrão por 72 semanas seria questionável.

Limitação central de desenho: o estudo NÃO é cego (open-label). Tanto participantes quanto investigadores sabiam qual fármaco foi alocado — abre porta para viés de condução e detecção (ver pergunta 8).

Pergunta 04 da ficha

Descreva os critérios para seleção dos participantes.

Resposta

Critérios de inclusão

Idade ≥ 18 anos
IMC ≥ 30 kg/m², OU IMC ≥ 27 kg/m² + pelo menos uma complicação relacionada à obesidade (HAS, dislipidemia, AOS ou DCV)
Relato de pelo menos uma tentativa dietética malsucedida para perda de peso

Critérios de exclusão (chave)

Diabetes mellitus tipo 2 — exclusão definidora deste trial vs SURMOUNT-2
Tratamento cirúrgico prévio ou planejado para obesidade
Uso de medicação para perda de peso ou agonista GLP-1 nos últimos 90 dias
Mudança de peso > 5 kg nos últimos 90 dias (estabilidade ponderal exigida)

Estratificação da randomização

Estratificada por IMC basal (< 35 vs ≥ 35), sexo, e status de pré-diabetes (definido por testes laboratoriais em jejum no screening).

Significado da estratificação: balanceia covariáveis fortemente associadas ao desfecho (resposta à perda de peso difere por sexo, IMC inicial e disglicemia). Reduz risco de desequilíbrio por acaso entre os braços.

Características basais (Tabela 1 do artigo)

Idade média

44,7

anos (DP 12,8)

Sexo feminino

64,7%

485 / 750

Peso médio

113,0

kg (DP 25,6)

IMC médio

39,4

kg/m² (DP 7,6)

Cintura

118,3

cm (DP 16,9)

Pré-diabetes

56,7%

425 / 750

≥2 complicações

50,1%

376 / 750

Duração obesidade

anos (DP 11,3)

Distribuição racial/étnica: 76,1% brancos, 19,2% negros, 2,4% asiáticos, 26,1% Hispanic/Latino — diversidade etnoracial relativamente boa para um trial NEJM, mas com sub-representação populacional global (especialmente Sul Global, Ásia oriental, indígenas).

Pergunta 05 da ficha

Caracterize as intervenções (ou exposições) estudadas.

Resposta

Ambos os fármacos foram administrados subcutâneos, uma vez por semana, por 72 semanas, em dose máxima tolerada — esquema de escalonamento progressivo.

Esquema de tirzepatide (braço de intervenção)

Início: 2,5 mg/semana
Aumento de 2,5 mg a cada 4 semanas
Alvo: 10 mg ou 15 mg (a dose máxima tolerada que o paciente conseguir manter)
Resultado: 89,3% receberam pelo menos uma dose de 15 mg

Esquema de semaglutide (comparador)

Início: 0,25 mg/semana
Escalonamento mensal: 0,5 → 1,0 → 1,7 → 2,4 mg
Alvo: 2,4 mg (ou manter em 1,7 mg se efeitos adversos limitarem) — protocolo idêntico ao STEP 1
Resultado: 92,8% receberam pelo menos uma dose de 2,4 mg

Manejo conjunto

Aconselhamento de dieta e atividade física em ambos os braços
Possibilidade de até 2 ciclos de descida-reescalada de dose se intolerância
Se IMC caísse para 22 → ajustar dose ou ingestão calórica para evitar emagrecimento excessivo
Quem não tolerasse permanecia em follow-up (estimand modificado captura este efeito)

Atenção crítica: a comparação é entre doses máximas toleradas, não doses fixas. Em tese, comparar dois fármacos no "teto" terapêutico de cada um é defensável (cabeça-a-cabeça verdadeiro). Mas isso impede inferência sobre comparações de doses sub-máximas (e.g., tirzepatide 5 mg vs semaglutide 2,4 mg) — comuns na prática.

03 / Métodos

Desfechos, hipóteses, viéses.

Perguntas 6–9: o que foi medido, como, qual a hipótese nula, e como os autores se protegeram de erros sistemáticos e aleatórios.

Pergunta 06 da ficha

Identifique o desfecho primário e como foi avaliado. Classifique a importância.

Resposta

Desfecho primário: mudança percentual no peso corporal da linha de base à semana 72.

Como foi medido: peso aferido em consulta presencial, comparado ao basal. A estimativa central usou um modelo de análise de covariância (ANCOVA) com tratamento, fatores de estratificação (pré-diabetes, sexo, IMC) e valor basal como covariáveis.

Desfechos secundários-chave (também ajustados para multiplicidade):

Proporção atingindo redução ≥ 10%, 15%, 20% e 25% do peso
Mudança absoluta na circunferência da cintura

Desfechos secundários adicionais (sem ajuste de multiplicidade): redução ≥30%, mudança em kg, mudança em IMC, pressão arterial, HbA1c, glicemia de jejum, lipídios, eventos adversos.

Classificação de importância — análise crítica

Classificação justificada: (2) IMPORTANTE, mas não totalmente crítico.

Peso e composição corporal são alvos diretos da intervenção e fortemente associados a melhora cardiometabólica. Porém, peso é um desfecho intermediário (surrogate) — o desfecho clinicamente "duro" final seria redução de eventos cardiovasculares maiores (MACE), mortalidade ou remissão de comorbidades (e.g., AOS, DM2).

O SELECT trial (semaglutide) já demonstrou redução de MACE com semaglutide. Para tirzepatide, o SURMOUNT-MMO (em curso) responderá essa pergunta. Até lá, a inferência aqui é sobre eficácia ponderal, não sobre desfechos duros.

Hierarquia GRADE simplificada: (1) pouco importante — biomarcadores isolados sem ligação clínica; (2) importante — surrogates validados; (3) crítico — mortalidade, MACE, qualidade de vida medida.

Pergunta 07 da ficha

Qual é a hipótese nula? (escreva no formato PICO + quantificação)

Resposta — PICO completo

População

Adultos ≥ 18 anos com obesidade (IMC ≥30, ou ≥27 com pelo menos uma complicação relacionada) sem diabetes, com tentativa dietética malsucedida prévia.

Intervenção

Tirzepatide SC, 1×/semana, em dose máxima tolerada (10 mg ou 15 mg), por 72 semanas.

Comparador

Semaglutide SC, 1×/semana, em dose máxima tolerada (1,7 mg ou 2,4 mg), por 72 semanas.

Outcome (desfecho)

Mudança percentual média no peso corporal da linha de base à semana 72 — medida de associação: diferença de médias entre grupos (em pontos percentuais).

H₀ (hipótese nula):

"Em adultos com obesidade sem diabetes, não há diferença na variação percentual média do peso corporal em 72 semanas entre tirzepatide (10 ou 15 mg/sem) e semaglutide (1,7 ou 2,4 mg/sem) — ou seja, a diferença entre médias é igual a zero."

Formalmente: μ_tirzepatide − μ_semaglutide = 0

H₁ (alternativa bilateral):

"Existe diferença entre as duas intervenções na variação percentual de peso (μ_tirzepatide − μ_semaglutide ≠ 0)."

Os autores planejaram o estudo para detectar uma diferença de 3 pontos percentuais, embora o teste seja bilateral (não pré-especifica direção).

Por que diferença de médias (e não risco relativo) para o primário? O desfecho primário é uma variável contínua (% de mudança de peso). Para os secundários binários (≥10%, ≥15%...) o trial calculou razão de risco (RR) via G-computation sobre regressão logística — formalismo apropriado para desfechos dicotômicos.

Pergunta 08 da ficha

Analise os fatores que podem diminuir a qualidade do estudo (viéses).

Resposta — análise sistemática por domínio (Cochrane RoB 2)

1. Geração da sequência de alocação

Baixo risco

Randomização computacional via sistema interativo de resposta web (IWRS), com estratificação por IMC, sexo e pré-diabetes. Procedimento adequado.

2. Sigilo da alocação

Baixo risco

Sistema centralizado eletrônico (IWRS) — investigadores não tinham acesso prévio à sequência. Procedimento adequado.

3. Viés de condução (performance)

Alto risco

Open-label. Pacientes e equipe sabiam o fármaco. Pode influenciar adesão, comportamento alimentar, motivação, expectativa de eficácia. Tirzepatide é o "produto novo e mais discutido na mídia" — possível efeito de expectativa.

4. Viés de detecção

Risco moderado

Peso e cintura são desfechos objetivos (mensurações em balança/fita) — risco menor. Mas eventos adversos (náusea, fadiga, reação local) dependem de relato subjetivo. Em open-label, há viés de notificação assimétrico.

5. Viés de atrito

Baixo risco

Descontinuação: 14,9% (tirz) vs 19,8% (sema) — assimétrica mas razoável. Estimand modificado tratou descontinuação como evento. Múltipla imputação via regras de Rubin.

6. Relato seletivo

Baixo risco

Protocolo registrado em clinicaltrials.gov (NCT05822830) e publicado no NEJM como suplemento. Todos os endpoints declarados foram reportados.

7. Conflito de interesse / patrocínio

Alto risco

Eli Lilly (fabricante do tirzepatide) desenhou o estudo, fez monitoramento, coletou e analisou os dados. Autores principais (primeiro e último) escreveram o manuscrito. Acordos de confidencialidade. Viés do patrocinador é um fator real e bem documentado na literatura em ensaios industriais.

8. Generalização (validade externa)

Moderado

76% brancos, 65% mulheres, populacionalmente concentrado em EUA. Exclui DM, cirurgia prévia, GLP-1 recente. Aplicabilidade ao Brasil/SUS é limitada (ver Q13).

Veredito de viés: as duas grandes vulnerabilidades são o desenho open-label e o patrocínio industrial integrado. Os autores reconhecem o open-label e argumentam que a consistência com trials anteriores (cegos) sustenta a generalizabilidade — argumento legítimo mas não eliminador do viés.

Pergunta 09 da ficha

Como se procedeu para controle de erros aleatórios?

Resposta — planejamento estatístico

Cálculo amostral (planejamento)

α (erro tipo I): 0,05 bilateral
Poder (1 − β): 90%
Δ esperado: diferença de 3 pontos percentuais entre grupos
DP assumido: 12%
Descontinuação esperada: 20% (na realidade ficou em ~18% global)
N planejado: 700 (350 por braço); recrutaram 751
Teste: dois-amostral t de duas caudas

Cálculo de poder bem feito é raro: os autores especificaram poder, α, Δ, DP antes de iniciar o trial e recrutaram 7% acima do mínimo — proteção contra perda amostral inesperada.

Controle de comparações múltiplas

Endpoints primário e secundários-chave (≥10%, ≥15%, ≥20%, ≥25%; circunferência da cintura) foram testados via procedimento gráfico de testes (graphical testing procedure), mantendo o erro tipo I global em α = 0,05.

Endpoints secundários adicionais (≥30%, kg, IMC, PA, HbA1c, lipídios) não foram ajustados para multiplicidade — os intervalos de confiança devem ser interpretados como descritivos, não inferenciais. O artigo explicita essa restrição (nota da Tabela 2).

Intervalos de confiança

IC 95% reportados para todas as estimativas de mudança de peso, cintura, RR de atingimento de metas, mudança de PA, etc.
Para o desfecho primário: IC95% da diferença = (−8,1 a −4,9). Não inclui zero → consistente com rejeição de H₀.

Análises de sensibilidade

Estimand modificado de regime-de-tratamento (primário): contabiliza descontinuação prematura ou início de medicação concomitante. Mais conservador.
Estimand de eficácia (sensibilidade): avalia "se completasse o tratamento, o que aconteceria?". Resultado: tirz −22,8 kg vs sema −15,0 kg (mais favorável ao tirzepatide).

Veredito estatístico: planejamento amostral robusto, controle adequado de multiplicidade nos endpoints principais, IC bem reportados, dois estimands complementares. O controle de erros aleatórios é tecnicamente sólido.

04 / Resultados

Os dados, em foco.

Perguntas 10–11: interpretação da figura/tabela principal e inferência sobre a hipótese nula.

Pergunta 10 da ficha

Identifique e interprete a principal tabela/figura produzida em função da hipótese nula.

Resposta — Figura 1 + Tabela 2

A Figura 1 (Painéis A, B, C) e a Tabela 2 trazem juntas o coração da resposta ao trial.

Painel A — mudança percentual média de peso

Tirzepatide

−20,2%

IC95% −21,4 a −19,1

Semaglutide

−13,7%

IC95% −14,9 a −12,6

Diferença

−6,5

p.p. · IC95% −8,1 a −4,9 · P<0,001

Painel B — proporção que atingiu metas pré-definidas (RR)

Meta	Tirzepatide	Semaglutide	Razão de risco (IC95%)
≥ 10%	81,6% (304/374)	60,5% (227/376)	1,3 (1,2–1,5)
≥ 15%	64,6% (241)	40,1% (151)	1,6 (1,4–1,9)
≥ 20%	48,4% (181)	27,3% (103)	1,8 (1,5–2,2)
≥ 25%	31,6% (118)	16,1% (60)	2,0 (1,5–2,6)
≥ 30% *	19,7% (74)	6,9% (26)	2,8 (1,9–4,3)

* ≥30% é endpoint secundário adicional (não ajustado para multiplicidade — interpretar como exploratório).

Painel C — mudança em cintura

Tirzepatide

−18,4 cm

IC95% −19,6 a −17,2

Semaglutide

−13,0 cm

IC95% −14,3 a −11,7

Diferença

−5,4 cm

IC95% −7,1 a −3,6 · P<0,001

Interpretação integrada

A magnitude da diferença (6,5 p.p.) é clinicamente relevante, não apenas estatisticamente significativa.
A relação dose-resposta de "número que atinge meta" é consistente em todas as faixas (≥10% até ≥30%) — coerência interna que reforça a credibilidade.
A diferença na cintura (5,4 cm) excede o limiar de 4 cm associado a redução de mortalidade em meta-análises populacionais.
Quanto maior a meta, maior o RR — passa de 1,3 (≥10%) para 2,8 (≥30%). O tirzepatide brilha mais nos extremos superiores de perda.

Pergunta 11 da ficha

Os resultados permitem inferir sobre a hipótese nula? Se sim, qual a inferência adequada?

Resposta

Sim — a H₀ é rejeitada.

P < 0,001 para o desfecho primário
IC 95% da diferença (−8,1 a −4,9) não contém o zero
O resultado é robusto a ambos os estimands (modificado e de eficácia)
Consistência entre desfechos primário, secundários e exploratórios

Inferência adequada:

Sob as suposições do modelo, é extremamente improvável (P < 0,001) observar uma diferença de magnitude tão grande ou maior entre tirzepatide e semaglutide se as duas intervenções produzissem, na média, o mesmo efeito ponderal em 72 semanas. Concluímos que tirzepatide produz redução percentual média de peso superior à do semaglutide, com magnitude pontual estimada em 6,5 pontos percentuais (IC95% 4,9–8,1).

Inferências que NÃO se justificam diretamente do P-valor:

"Tirzepatide é melhor para reduzir mortalidade" — não testado neste estudo
"A diferença de 6,5 p.p. é clinicamente importante para todo paciente" — depende da meta individual e perfil de risco
"O efeito persistirá além de 72 semanas" — não há dados além desse horizonte aqui
"Tirzepatide é superior ao semaglutide em doses sub-máximas" — só dose máxima foi comparada

05 / Validade

Quanto vale o que se conclui.

Perguntas 12–14: validade interna (metodológica), validade externa (generalização) e inferência sobre a hipótese conceitual.

Pergunta 12 da ficha

O trabalho tem validade interna? Metodologicamente é um estudo adequado com baixo risco de viés?

Resposta — síntese da Q8

✓ Pontos fortes

Randomização adequada (IWRS, estratificada)
Sigilo de alocação preservado
Tamanho amostral planejado com poder 90%
Estratificação por covariáveis relevantes (IMC, sexo, pré-diabetes)
Estimand pré-especificado e conservador (modificado)
Controle de multiplicidade com testing graphical procedure
Análise de sensibilidade com estimand alternativo (eficácia)
Relato completo (CONSORT) e protocolo público
Desfechos primário e secundários objetivos (peso, cintura)

✗ Limitações metodológicas

Open-label — risco real de viés de condução
Patrocínio integrado pela Eli Lilly (desenho, coleta, análise) — viés do patrocinador
Ausência de braço placebo (defensável eticamente)
Eventos adversos com componente subjetivo afetados pelo não-cegamento
Comparação apenas em dose máxima tolerada — não cobre regimes mais baixos comuns na prática
Horizonte de 72 semanas — sustentação de longo prazo desconhecida

Veredito sobre validade interna: moderada a alta. O estudo é metodologicamente sólido nos aspectos estruturais (randomização, sigilo, cálculo amostral, análise) mas tem duas vulnerabilidades reais — open-label e patrocínio industrial — que reduzem o nível de confiança máxima que se pode atribuir aos achados isoladamente.

Atenuante importante: os efeitos pontuais observados aqui são consistentes com o que trials cegos (SURMOUNT-1, STEP 1, e comparações indiretas em JAMA 2024) já haviam sinalizado. A coerência externa aumenta a confiança apesar do open-label.

Pergunta 13 da ficha

O trabalho tem validade externa? Quanto a população do estudo reflete a realidade da prática clínica brasileira?

Resposta — análise contextual UFRGS/SUS

Aspectos favoráveis à generalização

População diversificada dentro do contexto americano: 19% pretos, 26% Hispanic/Latino — diversidade melhor que o usual em trials NEJM
35% de homens (mais do que os trials STEP, que tinham 19–26% homens) — reflete um espectro de gênero mais equilibrado
50% com ≥2 complicações da obesidade — perfil clínico realista (não "saudáveis fora a obesidade")
Esquema posológico ajustado individualmente (dose máxima tolerada) — espelha a prática real, não apenas dose-fixa
32 sites — heterogeneidade de centro

Aspectos que limitam a generalização ao Brasil

População exclusivamente EUA+Porto Rico — não inclui Brasil, América Latina (Hispanic ≠ Brasil), África, Ásia.
76% brancos — proporção muito maior do que a brasileira (~43% brancos pelo IBGE).
Exclusão de diabetes — no Brasil, prevalência de DM2 + obesidade combinadas é alta; muitos pacientes da prática real são excluídos.
Exclusão de uso recente de GLP-1 — paciente real frequentemente já tentou outros agentes.
Acesso ao tirzepatide: aprovado pela ANVISA, mas custo no Brasil ~R$ 1.500–2.500/mês (varia por dose, plataforma e dose semanal). SUS não oferece; planos de saúde têm cobertura limitada (geralmente apenas DM2). Acesso real à intervenção é restrito a uma minoria com poder de compra.
Aconselhamento dietético estruturado e acesso a centros especializados — o contexto americano de cuidado é mais intensivo que o disponível no SUS.

Veredito sobre validade externa: baixa-a-moderada para o contexto SUS brasileiro, moderada para a prática privada brasileira. A magnitude de eficácia provavelmente se mantém em populações brasileiras (não há razão biológica para diferença), mas a aplicabilidade é fortemente limitada por barreira financeira — o impacto populacional do achado depende mais de política de acesso do que da farmacologia em si.

Epidemiologia aplicada: trial com eficácia robusta mas baixa cobertura populacional → impacto agregado depende do número de pacientes tratáveis × NNT. Para o Brasil, o número de pacientes com acesso real ao tirzepatide é uma fração pequena do denominador de obesidade.

Pergunta 14 da ficha

Qual é a inferência sobre a hipótese conceitual?

Resposta

A hipótese conceitual (Q2) afirmava que o dual-agonismo GIP/GLP-1 é farmacologicamente superior ao monoagonismo GLP-1 em obesidade sem DM2. Os achados do SURMOUNT-5 sustentam essa hipótese:

Magnitude da diferença (6,5 p.p.) é consistente com mecanismo aditivo/sinérgico
Efeito é maior em metas elevadas (RR cresce de 1,3 para 2,8 quando passamos de ≥10% para ≥30%) — sugere componente farmacológico adicional, não apenas variação
Mudança em cintura também maior — coerente com hipótese de ação direta em adipócitos via receptor GIP
Coerência com modelos pré-clínicos (Samms et al., J Clin Invest 2021; Regmi et al., Cell Metab 2024) que demonstraram regulação direta de nutrientes em adipócitos via GIP

Inferência conceitual fundamentada:

Em adultos com obesidade sem DM2, a adição do agonismo GIP ao agonismo GLP-1 confere benefício ponderal incremental clinicamente relevante, provavelmente mediado por mecanismos complementares (central + periférico em adipócitos). A diferença não é explicável apenas por variação aleatória ou diferenças de dose-equivalência.

Limites da inferência conceitual:

Não testa se o efeito é GIP-específico ou se outras moléculas duais (e.g., retatrutida — GIP/GLP-1/glucagon) teriam o mesmo efeito
Não esclarece se a sinergia é farmacodinâmica ou farmacocinética
Não testa em DM2 (onde a fisiopatologia é diferente — incretina reduzida)

06 / Aplicabilidade Clínica

Da estatística para a cabeceira.

Perguntas 15–18: segurança, significância clínico-farmacológica, NNT e custo da intervenção.

Pergunta 15 da ficha

Qual a segurança da intervenção proposta?

Resposta — Tabela 3 do artigo

Perfil geral de eventos adversos

Variável	Tirzepatide (N=374)	Semaglutide (N=376)
AEs durante tratamento	76,7% (287)	79,0% (297)
AEs sérios	4,8% (18)	3,5% (13)
Mortes	0	0
Descontinuação por AE	6,1% (23)	8,0% (30)
Descontinuação por AE GI	2,7% (10)	5,6% (21)

Eventos GI (mais comuns, predominantemente leves a moderados)

Náusea: 43,6% (tirz) vs 44,4% (sema) — equivalente
Constipação: 27,0% vs 28,5%
Diarreia: 23,5% vs 23,4%
Vômito: 15,0% vs 21,3% — menor com tirzepatide

Outros eventos de interesse

Reação no local de injeção: 8,6% (tirz) vs 0,3% (sema) — maior com tirzepatide — característica de formulação
Alopecia: 8,3% vs 6,1% — sintoma frequentemente associado a perda de peso rápida (mecanismo não-fármaco-específico)
Pancreatite: 0 vs 1 caso (adjudicado, semaglutide)
Carcinoma medular de tireoide: 0 em ambos os braços
Eventos cardiovasculares maiores: nenhum adjudicado em ambos

Perfil de segurança geral: Ambos os fármacos com perfil de segurança consistente com trials anteriores (SURMOUNT, STEP). Eventos GI são esperados de classe incretina e ocorrem majoritariamente durante o escalonamento de dose, sendo leves a moderados. O tirzepatide teve numericamente menos descontinuações por intolerância GI mas mais reações de injeção.

Limitações da avaliação de segurança:

72 semanas é horizonte curto para detectar eventos raros (pancreatite, neoplasias)
Estudo open-label → viés de notificação possível
Excluiu DM2 — pacientes mais frágeis (alto risco cardiovascular, polimedicados) não testados

Pergunta 16 da ficha

Os resultados têm significância farmacológico-clínica? Qual é a sua aplicabilidade?

Resposta — significância além do "P < 0,05"

Estatística vs clínica

O P-valor diz apenas que a diferença observada é improvável sob a H₀. Significância clínica exige outra pergunta: a diferença é grande o suficiente para mudar conduta, melhorar vida, ou justificar custo?

A diferença de 6,5 p.p. é clinicamente relevante?

Limiar de remissão de AOS: ~7–11% de perda. Mais pacientes com tirzepatide cruzam esse limiar.
Limiar de remissão de DM2 precoce: 10–15%. Mais pacientes com tirzepatide.
Limiar associado a redução de eventos CV (extrapolando SELECT): ≥5% confere benefício, mas magnitudes maiores parecem benéficas em proporção.
Pressão arterial: tirzepatide reduziu PAS em −10,2 mmHg vs −7,7 mmHg com semaglutide. Diferença de 2,5 mmHg em PAS população-nível associa-se a redução notável de eventos CV em meta-análises.
Cintura −5,4 cm a mais: uma meta-análise mostrou aumento de 7–9% de mortalidade por cada 5 cm adicional de cintura. A redução incremental potencialmente mitiga risco.

Significância clínica: SIM, é clinicamente significativa. A diferença não é "estatística trivial" — afeta proporção de pacientes que atingem metas terapêuticas relevantes (remissão de comorbidades, redução de risco CV).

Aplicabilidade ao paciente real

Paciente que busca perda modesta (5–10%): diferença entre os agentes é proporcionalmente menor; semaglutide é alternativa razoável, especialmente considerando custo.
Paciente que busca perda ≥ 15% (e.g., para remissão de AOS, DM2 incipiente): tirzepatide tem probabilidade 1,6× maior de atingir a meta. Tirzepatide é primeira escolha, se disponível.
Paciente que tolera mal injeção: semaglutide tem reação local muito menor.
Paciente com história de vômitos prévios / intolerância GI severa: tirzepatide pode ser melhor (menor descontinuação por GI).
Paciente com DCV estabelecida: hoje, semaglutide tem evidência CV (SELECT). Tirzepatide aguarda SURMOUNT-MMO.

Pergunta 17 da ficha

Quantos desfechos poderão ser evitados com a intervenção? Calcule o NNT.

Resposta — cálculos passo-a-passo

O NNT (number needed to treat) = 1 / ARR (absolute risk reduction). Para uma intervenção benéfica, indica quantos pacientes precisamos tratar (com tirzepatide ao invés de semaglutide) para que 1 paciente adicional atinja a meta.

NNT para metas de perda de peso (SURMOUNT-5)

Tirzepatide vs Semaglutide · 72 sem · obesidade sem DM2

Meta ≥ 10%

NNT ≈ 5

ARR = 81,6% − 60,5% = 21,1%

A cada 5 pacientes tratados com tirzepatide ao invés de semaglutide, 1 adicional atinge ≥10% de perda.

Meta ≥ 15%

NNT ≈ 5

ARR = 64,6% − 40,1% = 24,5%

1 paciente adicional atinge ≥15% — limiar de remissão de AOS e melhora cardiometabólica.

Meta ≥ 20%

NNT ≈ 5

ARR = 48,4% − 27,3% = 21,1%

1 paciente adicional atinge ≥20% — limiar próximo do efeito bariátrico para muitos casos.

Meta ≥ 25%

NNT ≈ 7

ARR = 31,6% − 16,1% = 15,5%

1 paciente adicional atinge perda muito alta (≥25%) — análoga à perda bariátrica.

Meta ≥ 30%

NNT ≈ 8

ARR = 19,7% − 6,9% = 12,8%

Meta exploratória sem ajuste de multiplicidade — interpretar como tendência.

Interpretação clínica do NNT ≈ 5: em uma faixa de NNT 5–8 a intervenção é considerada de alto impacto clínico em farmacoterapia preventiva. Para comparação: estatinas em prevenção primária têm NNT de ~50–100 para evitar 1 evento CV em 5 anos; metformina em prediabetes tem NNT ~7 para evitar 1 caso de DM em 3 anos. O NNT do tirzepatide para metas ponderais ambiciosas é excelente — mas o "desfecho" aqui é metabólico/intermediário, não duro.

Pergunta 18 da ficha

Quanto custa para prevenir um desfecho?

Resposta — análise farmacoeconômica

Para estimar o custo de evitar um desfecho adicional (≥15% de perda) com tirzepatide vs semaglutide, multiplicamos o NNT pelo custo do tratamento por paciente em 72 semanas.

Premissas de preço (estimativas referenciais, maio/2025)

Fármaco	EUA (lista)	Brasil (privado, dose máx)
Tirzepatide (Mounjaro / Zepbound)	~US$ 1.060/mês	~R$ 1.800–2.500/mês
Semaglutide (Wegovy / Ozempic)	~US$ 1.350/mês	~R$ 1.100–1.500/mês

Os valores variam por dose, fonte (Lilly Direct nos EUA tem preço menor para Zepbound; no Brasil há variação por importação direta e farmácia).

Cenário EUA — custo por desfecho ≥15% prevenido

Custo de 72 sem (~16,6 meses) por paciente:
- Tirzepatide: 16,6 × US$ 1.060 ≈ US$ 17.600
- Semaglutide: 16,6 × US$ 1.350 ≈ US$ 22.400
NNT 5 (≥15%): tratar 5 pacientes com tirz ao invés de sema =
- Custo total tirz: 5 × US$ 17.600 ≈ US$ 88.000
- Custo total sema: 5 × US$ 22.400 ≈ US$ 112.000
- Economia de US$ 24.000 + 1 desfecho ≥15% adicional → tirzepatide domina (mais eficaz e mais barato no preço de lista EUA)

Cenário Brasil — análise mais realista

Custo de 72 sem por paciente:
- Tirzepatide: 16,6 × R$ 2.000 ≈ R$ 33.000 (estimativa intermediária)
- Semaglutide: 16,6 × R$ 1.300 ≈ R$ 21.600
- Custo incremental: R$ 11.400 por paciente
NNT 5 (≥15%): custo incremental por desfecho adicional ≈ 5 × R$ 11.400 = R$ 57.000
NNT 7 (≥25%): 7 × R$ 11.400 = R$ 80.000 para 1 desfecho extra de perda muito alta
NNT 5 (perda absoluta de 5,4 cm em cintura): implícito — todo paciente em tirzepatide perde +5,4 cm a mais; "NNT" não se aplica diretamente (variável contínua)

Veredito farmacoeconômico para o Brasil: R$ 57.000 por desfecho adicional de ≥15% é caro em termos absolutos, mas precisa ser confrontado com o custo evitado de comorbidades (internações por DM2 descompensado, eventos CV, cirurgia bariátrica, CPAP de longo prazo etc.). Estudos formais de custo-efetividade serão necessários — o ICUR (incremental cost-utility ratio) provavelmente ficará acima dos R$ 30.000/QALY que o REBRATS sugere como threshold de custo-efetivo no SUS.

Limitações da análise: não considera custo de comorbidades evitadas, descontos comerciais, adesão de longo prazo, e o fato de que a maioria dos pacientes provavelmente requererá tratamento crônico — não apenas as 72 semanas do trial. O custo lifetime tende a ser muito maior que o estimado aqui.

Pearl epidemiológico final: mesmo um NNT pequeno (5) não garante custo-efetividade se o preço unitário do fármaco for muito alto. A equação completa é NNT × preço incremental ≤ valor monetário do desfecho evitado. No Brasil, essa equação ainda não fecha favorável ao tirzepatide para a maioria dos pacientes via SUS.

07 / Síntese crítica

O que levar.

Pontos-chave de uma leitura crítica do SURMOUNT-5 — o que defender em mesa redonda e o que questionar.

Tirzepatide é superior em magnitude de perda

Em 72 sem, redução média de 20,2% vs 13,7% (Δ −6,5 p.p.; IC95% −8,1 a −4,9; P<0,001). Magnitude clinicamente relevante e robusta a múltiplos estimands.

NNT 5 para perda ≥15%

A cada 5 pacientes tratados com tirzepatide ao invés de semaglutide, 1 a mais atinge perda ≥15% — limiar de remissão de AOS e melhora cardiometabólica.

Validade interna boa, com 2 ressalvas

Randomização e análise sólidas, mas open-label e patrocínio integrado da Eli Lilly são vulnerabilidades reais — não fatais, mas precisam ser declaradas.

Validade externa limitada no SUS

76% brancos, EUA-only, exclui DM2 e GLP-1 recente. Custo no Brasil torna a aplicação populacional restrita à minoria com acesso privado.

Sem dados de mortalidade ou MACE

O desfecho primário é peso (intermediário). Para tirzepatide, a evidência cardiovascular dura virá com o SURMOUNT-MMO (em curso). Para semaglutide, o SELECT já mostrou redução de MACE.

Seguranças similares; segurança não é o diferencial

Ambos com AEs GI leves a moderados, sem mortes, sem sinais novos. Tirzepatide teve mais reação no local de injeção; semaglutide, mais vômito e descontinuação por GI.

A pergunta não é "qual é melhor?", mas "para qual paciente?"

Para perda ambiciosa (≥15–20%) → tirzepatide. Para perda modesta + DCV estabelecida → semaglutide (com SELECT). Para o SUS → ambos inviáveis no momento; lifestyle estruturado + bariátrica continuam o padrão público.

A epidemiologia importa

P-valor não basta. Discutir NNT, IC, multiplicidade, estimands, validade externa, custo-efetividade é parte integral da análise farmacológica moderna — o "flerte" da farmacologia com a epidemiologia é exatamente essa exigência de rigor inferencial.

Como defender este artigo em mesa redonda da UFRGS:

Reconheça que tirzepatide é superior em magnitude de perda — é a evidência mais limpa que existe hoje (Q1, Q10, Q11).
Insista que o desfecho é intermediário — peso, não MACE/mortalidade (Q6).
Identifique o open-label como a maior fraqueza metodológica e o patrocínio como contexto importante (Q8, Q12).
Quantifique o ganho clínico via NNT 5 para ≥15% — número compreensível e útil para shared decision-making (Q17).
Termine com a questão de acesso/custo — no contexto UFRGS/SUS, eficácia ≠ aplicabilidade populacional (Q13, Q18).

SURMOUNT-5,decifrado.

A pergunta clínica.

Dual-agonismo GIP/GLP-1

Monoagonismo GLP-1

O ensaio em perspectiva.

Critérios de inclusão

Critérios de exclusão (chave)

Estratificação da randomização

Características basais (Tabela 1 do artigo)

Esquema de tirzepatide (braço de intervenção)

Esquema de semaglutide (comparador)

Manejo conjunto

Desfechos, hipóteses, viéses.

Classificação de importância — análise crítica

Cálculo amostral (planejamento)

Controle de comparações múltiplas

Intervalos de confiança

Análises de sensibilidade

Os dados, em foco.

Painel A — mudança percentual média de peso

Painel B — proporção que atingiu metas pré-definidas (RR)

Painel C — mudança em cintura

Interpretação integrada

Quanto vale o que se conclui.

✓ Pontos fortes

✗ Limitações metodológicas

Aspectos favoráveis à generalização

Aspectos que limitam a generalização ao Brasil

Da estatística para a cabeceira.

Perfil geral de eventos adversos

Eventos GI (mais comuns, predominantemente leves a moderados)

Outros eventos de interesse

Estatística vs clínica

A diferença de 6,5 p.p. é clinicamente relevante?

Aplicabilidade ao paciente real

Premissas de preço (estimativas referenciais, maio/2025)

Cenário EUA — custo por desfecho ≥15% prevenido

Cenário Brasil — análise mais realista

O que levar.

Tirzepatide é superior em magnitude de perda

NNT 5 para perda ≥15%

Validade interna boa, com 2 ressalvas

Validade externa limitada no SUS

Sem dados de mortalidade ou MACE

Seguranças similares; segurança não é o diferencial

A pergunta não é "qual é melhor?", mas "para qual paciente?"

A epidemiologia importa

SURMOUNT-5,
decifrado.