Existe um exame nacional que usa Teoria de Resposta ao Item, é aplicado pelo INEP, tem correção TRI oficial — mas não é o ENEM. É o ENAMED. E o modelo de TRI que ele usa é completamente diferente do que você conhece. Eu li as três notas técnicas oficiais do INEP para te explicar o que ninguém está explicando.

Fala, pessoal! Aqui é o Professor Xandão, CEO da XTRI Analytics & Psicometria. Hoje eu preciso falar sobre um assunto que pouca gente domina de verdade: a TRI do ENAMED – ENAMED TRI

Não vou te dar um resumo superficial — vou abrir as notas técnicas oficiais do INEP, mostrar as fórmulas, os métodos, as decisões e os argumentos técnicos por trás de cada escolha.

Se você é estudante de medicina, professor, gestor de IES ou simplesmente alguém que quer entender como a avaliação educacional funciona no Brasil, esse artigo é para você.

Se você acompanha nosso blog, já sabe que o ENEM utiliza TRI com modelo de 3 parâmetros.

Mas o que quase ninguém sabe — nem mesmo muitos professores de medicina — é que o ENAMED usa um modelo fundamentalmente diferente: o modelo de Rasch (1PL). E essa não é uma diferença técnica menor.

É uma diferença filosófica, epistemológica e prática que muda completamente o significado da nota.

Primeiro: o que é o ENAMED (e o que ele NÃO é)

Vou ser direto porque existe muita confusão por aí. O ENAMED — Exame Nacional de Avaliação da Formação Médica — não é o Revalida. São exames diferentes com públicos diferentes. O Revalida avalia médicos formados no exterior que querem revalidar o diploma no Brasil. O ENAMED avalia estudantes concluintes de cursos de medicina — aqueles que estão no último período — para medir a qualidade da formação que receberam.

Instituído pela Portaria MEC nº 330, de 23 de abril de 2025, o ENAMED é, na essência, a versão do ENADE específica para cursos de medicina.

Mas com um diferencial que muda tudo: a nota do ENAMED pode ser usada como critério de ingresso em programas de residência médica de acesso direto, por meio do ENARE (Exame Nacional de Residência).

Ou seja, o mesmo exame cumpre duas funções: avaliar a qualidade institucional dos cursos e selecionar médicos para a residência.

Conforme a Nota Técnica nº 42/2025 do INEP, os objetivos formais do ENAMED são:

1 – Avaliar se os concluintes adquiriram as competências exigidas pelas Diretrizes Curriculares Nacionais (DCNs)

2 – Fornecer insumos para melhoria dos cursos, unificar ENADE e prova teórica do ENARE

3 – Fortalecer o SUS e democratizar o ingresso na residência médica.

A primeira edição foi aplicada em 19 de outubro de 2025, em 225 municípios, com mais de 49 mil participantes (entre concluintes e profissionais). E aqui entra a parte que me interessa como psicometrista: como essa prova é corrigida?

A arquitetura da prova: 100 itens, 4 alternativas, e o BNI-ES

Segundo a NT 42/2025 do INEP, a prova do ENAMED 2025 foi composta por 100 questões objetivas de múltipla escolha, com 4 alternativas cada.

Os itens cobrem 5 grandes áreas: Clínica Médica, Cirurgia Geral, Pediatria, Ginecologia e Obstetrícia, e Medicina da Família e Comunidade — além de Saúde Coletiva e Saúde Mental.

E aqui vem um ponto que muita gente erra : os itens do ENAMED não são exclusivamente “criados do zero” para cada edição. A NT 19/2025 deixa claro que “os itens componentes do BNI-ES [Banco Nacional de Itens da Educação Superior] foram revisados, homologados e aprovados pela Comissão Assessora de Avaliação da Formação Médica (CAAFM).”

Os itens foram selecionados de um banco, em reuniões realizadas no Ambiente Físico Integrado Seguro (AFIS) do INEP, em maio e julho de 2025.

Ou seja: assim como o ENEM seleciona questões de um banco nacional de itens, o ENAMED também o faz. A diferença fundamental está no que acontece depois — na calibragem.

O modelo de Rasch (1PL): a escolha do INEP que quase ninguém entende

Agora vamos ao coração da questão. O ENEM usa o modelo TRI de 3 parâmetros (3PL): discriminação (a), dificuldade (b) e acerto ao acaso (c). O ENAMED usa o modelo de Rasch, também chamado de 1PL: apenas o parâmetro de dificuldade (b).

A NT 42/2025 apresenta a fórmula do modelo implementado:

P(X_ij = 1 | θ_j, b_i) = 1 / (1 + e^{-(θ_j – b_i)})

Onde θ_j é a proficiência do respondente j e b_i é a dificuldade do item i. Simples assim. Sem discriminação, sem chute. A probabilidade de acerto depende apenas da diferença entre a habilidade da pessoa e a dificuldade da questão.

Para quem está acostumado com o ENEM, isso parece incompleto.

Mas não é. É uma escolha deliberada, com justificativas técnicas profundas — e o INEP encomendou um documento inteiro para explicar por quê.

Por que Rasch e não 3PL? O argumento do grande mestre Ricardo Primi

O Prof. Ricardo Primi (Universidade São Francisco & EduLab21, Instituto Ayrton Senna) — um dos maiores nomes da psicometria brasileira — produziu uma nota técnica de justificativa para a adoção do modelo 1PL no ENAMED. E o argumento dele é, na minha opinião, como sempre, brilhante.

Primi começa situando duas tradições dentro da TRI: a abordagem de modelagem estatística (Lord, Birnbaum — tradição norte-americana dos modelos 2PL e 3PL, que prioriza reproduzir as curvas empíricas) e a abordagem psicométrica de Rasch (Rasch, Wright — que prioriza construir uma escala de medida coerente, com propriedades fortes de mensuração). Não são apenas modelos diferentes — são paradigmas diferentes.

E aqui vem o ponto central: ambos os modelos pressupõem unidimensionalidade — a ideia de que uma única dimensão latente explica os acertos e erros. Mas como Primi argumenta, “o conhecimento humano não é unidimensional”. Na medicina, um estudante pode dominar cardiologia e ser fraco em dermatologia. Pode gabaritar emergência e tropeçar em saúde coletiva. Existe uma “unidimensionalidade essencial”, mas com fatores locais de grupo.

E é aqui que a escolha do modelo se torna crítica.

O problema da discriminação em provas multidimensionais

Primi usa um exemplo que eu acho genial — e vou reproduzir aqui porque ele ilustra perfeitamente o problema. Imagine uma prova com 10 itens de medicina: 7 de clínica médica, 1 de cirurgia, 1 de GO e 1 de pediatria.

Se você usa um modelo 2PL ou 3PL, os 7 itens de clínica vão dominar a covariância e apresentar discriminação alta — simplesmente porque há muitos deles juntos, não porque são intrinsecamente “melhores”.

Resultado: um aluno A que acerta os 7 itens de clínica terá uma habilidade estimada maior do que um aluno B que acerta 4 de clínica + cirurgia + GO + pediatria. Mas quem sabe mais medicina?

O aluno A, que domina apenas um terço do conteúdo avaliado? Ou o aluno B, que demonstra conhecimento em todas as áreas?

Com o modelo de Rasch, isso não acontece. Todos os acertos são ponderados igualmente, preservando melhor a diversidade de habilidades do teste. A discriminação não entra para distorcer o peso de itens super-representados.

E tem mais: Primi argumenta que o parâmetro de discriminação pode refletir “idiossincrasias amostrais” — padrões que dependem do conjunto específico de itens e respondentes daquela prova, não propriedades estáveis do item.

Nas palavras dele: “ao estimar o parâmetro a, corre-se o risco de perpetuar idiossincrasias amostrais, reificando padrões locais como se fossem propriedades essenciais do item.”

Isso é particularmente grave quando se busca equalizar formas diferentes de prova entre edições — que é exatamente o plano do ENAMED.

O parâmetro de chute (c): o que Wright tinha a dizer

E o parâmetro c do modelo 3PL? Aquele que modela a probabilidade de acerto ao acaso — o famoso “chute”? Primi cita Wright (1995) para argumentar que “não são os itens que chutam, mas as pessoas”.

O chute é um comportamento de determinados respondentes em determinadas circunstâncias, não uma propriedade estável da questão.

No modelo 3PL (ENEM), o chute é incorporado como parâmetro estrutural de cada item — o que, segundo essa visão, pode penalizar indiscriminadamente respondentes com perfis de conhecimento específicos.

No modelo de Rasch (ENAMED), padrões inesperados de resposta são tratados pelas estatísticas de ajuste (infit e outfit), que qualificam a precisão da medida sem alterar a estrutura do escore. É uma abordagem mais transparente: em vez de reduzir sua nota silenciosamente porque o modelo “acha” que você chutou, o Rasch sinaliza que sua estimativa é menos confiável — mas mantém a nota intacta.

Na prática, isso significa que dois candidatos com o mesmo número de acertos no ENAMED terão notas TRI muito mais próximas do que dois candidatos com o mesmo número de acertos no ENEM.

No ENEM, a diferença pode passar de 100 pontos. No ENAMED, a diferença será mínima.

X-TRI Mentoria ENEM para Sua Escola

A equalização: por que Rasch é essencial para o futuro do ENAMED

Existe um argumento que, para mim, é decisivo — e que pouca gente discute. O ENAMED pretende ser um exame anual.

Diferentes edições terão formas diferentes de prova, possivelmente sem itens comuns entre elas. Para que as notas sejam comparáveis entre edições, é necessário algum tipo de equalização.

Primi argumenta que o modelo de Rasch é superior para isso porque garante que as Curvas Características dos Itens (CCIs) sejam paralelas. Quando as CCIs são paralelas, a hierarquia de dificuldade dos itens não muda conforme o nível de habilidade — o que é essencial para alinhar escalas entre provas diferentes.

Com o 3PL, as CCIs se cruzam (porque têm inclinações diferentes), e a ordenação de dificuldade pode variar conforme a faixa de habilidade, tornando a equalização instável.

Como o ENAMED planeja usar virtual equating — vinculação indireta baseada em hierarquias de dificuldade comparáveis, sem necessariamente compartilhar itens idênticos entre edições — a estabilidade do Rasch é uma vantagem enorme. É pensar no longo prazo.

Como a nota do ENAMED é calculada: o que a NT 42/2025 revela

Agora vamos à parte que faz meu coração de psicometrista bater mais forte. A Nota Técnica nº 42/2025 detalha todo o pipeline de cálculo, com uma transparência que eu gostaria de ver em todos os exames nacionais.

Aqui está o processo:

1. Software e modelo: A análise usa o pacote mirt v1.45.1 no R (versão 4.5.2), com o modelo de Rasch. A estimação dos parâmetros segue Máxima Verossimilhança Marginal via algoritmo Expectation-Maximization com quadratura de Gauss-Hermite (Bock & Aitkin, 1981).

2. Exclusão iterativa de itens — em 4 etapas sequenciais:

Etapa 1: Itens com Correlação Bisserial (CB) ≤ 0 são eliminados iterativamente — remove o pior, recalcula, repete até todos serem positivos. A CB é calculada com escore corrigido (o item analisado é excluído do escore total).
Etapa 2: Itens com |b| > 6,5 são eliminados (dificuldade extrema).
Etapa 3: Itens com infit > 2,0 são eliminados.
Etapa 4: Itens com outfit > 2,0 são eliminados.

3. Estimação da proficiência: Método EAP (Expected a Posteriori) — Bock & Mislevy, 1982 — com média zero e covariância extraída do modelo calibrado.

4. Transformação linear para a nota final:

NF = θ × 17,544 + 67,018

Onde θ é a proficiência EAP na escala (0,1), 17,544 é a constante de escala (DA) e 67,018 é a constante de localização (MA). Essas constantes foram determinadas pelo estimador True-Score (TS) da TRI, que ancora a escala ao ponto de corte definido pelo método Angoff. Notas abaixo de 0 são ajustadas para 0; acima de 100, para 100.

Esse é o nível de detalhe que eu queria ver publicado em linguagem acessível — porque a maioria dos estudantes de medicina recebe uma nota sem ter a menor ideia de como ela foi calculada.

O método de Angoff Modificado: como se define “médico proficiente”

A NT 19/2025 descreve o processo mais fascinante de toda a metodologia: como o INEP definiu a nota de corte entre “Proficiente” e “Não Proficiente”.

O método de Angoff Modificado funciona assim: um painel de 20 especialistas — professores de medicina da Comissão de Análise de Itens (CAI) — define o perfil do “médico minimamente competente” e então avalia cada item da prova, respondendo:

“Dado um conjunto de 100 médicos que acabaram de entrar nesse nível de proficiência, quantos responderão este item corretamente?”

Cada especialista, independentemente, atribui uma probabilidade a cada questão. A média de todas as probabilidades de todos os especialistas em todos os itens gera o ponto de corte.

Na prática, o painel atribuiu probabilidades que variaram de 31,25% (item mais difícil) a 75,75% (item mais fácil).

Dos 100 itens, 10 foram descartados: 6 anulados por recursos administrativos, 1 por erro material, e 3 por propriedades psicométricas inadequadas (CB abaixo do valor adequado). Restaram 90 itens.

A nota de corte Angoff final ficou em 57,87% com desvio padrão de 3,68 pontos. O coeficiente de concordância entre avaliadores (IRR) foi de 0,894 — classificado como “bom”, indicando alto grau de consistência no julgamento dos especialistas.

Dois avaliadores outliers foram removidos na segunda rodada (médias de 68,9% e 83,6%, muito distantes do grupo).

Esse valor de 57,87% na escala de acertos foi então transposto para a escala TRI usando o estimador True-Score (TS) — mapeando o escore Angoff na Curva Característica do Teste. Na escala θ (0,1), o ponto de corte ficou em -0,40. Aplicando a transformação linear (× 17,544 + 67,018), chegou-se à nota de corte de 60,0.

Se sua nota ENAMED é ≥ 60: Proficiente. Abaixo de 60: Não Proficiente.

A grande ironia: para o ENARE, a TRI não vale

E aqui vem um detalhe que, confesso, me pegou de surpresa. A NT 42/2025, na seção 7, é cristalina:

“A pontuação expressa como resultado do Enamed, calculada por TRI conforme descrito nas demais seções desta Nota Técnica, não será considerada, de maneira alguma, para fins do Enare 2025.”

Para fins do ENARE — ou seja, para a seleção de residência médica — o que vale é o percentual bruto de acertos. Uma questão = 1%.

Questões anuladas entram como acertadas. Habilitado com ≥ 50%, não habilitado com < 50%. Isso se deve à Resolução CNRM nº 17/2022, que exige “percentual mínimo de 50% de acertos” como critério eliminatório.

Ou seja: o INEP calcula a nota TRI com todo o rigor do modelo de Rasch, método Angoff, transformação linear — mas para a residência médica, o que conta é soma simples.

Uma dupla métrica no mesmo exame. A nota TRI serve para avaliar o curso (Conceito Enade). A soma simples serve para selecionar para a residência.

Na minha análise, isso é transitório. O INEP está construindo a infraestrutura psicométrica (escala TRI, método Angoff, equalização via Rasch) para que, em edições futuras, a nota TRI passe a ser o critério também para o ENARE. A

base técnica já está pronta — falta a regulação acompanhar.

Os dados da primeira edição: o que a distribuição de dificuldade revela

Analisando os microdados oficiais do INEP, os itens mantidos apresentaram parâmetros b variando de -3,538 (item extremamente fácil) a +2,415 (item muito difícil), com mediana em torno de -0,8. Isso indica uma prova predominantemente fácil, com a maioria dos itens concentrados abaixo de zero na escala de dificuldade.

A média de acertos dos participantes ficou em 59,34, com desvio padrão de 10,03 e mediana de 59. Na escala TRI transformada, a média ficou em 67,018 (por construção — é a constante MA) com desvio padrão de 17,544 (também por construção — é a constante DA).

Isso é coerente com o objetivo do exame: não criar um ranking ultra-fino como o ENEM, mas verificar se o concluinte atingiu um patamar mínimo de competência profissional. Uma prova mais fácil é mais sensível na parte inferior da escala — exatamente onde está o ponto de corte de proficiência.

X-TRI Mentoria ENEM para Sua Escola

O impacto: 99 cursos sob supervisão

Os resultados da primeira edição foram devastadores para parte das instituições. De 304 cursos do Sistema Federal de Ensino que participaram, 99 (32%) receberam conceitos 1 e 2 — insatisfatórios — e passaram a enfrentar medidas de supervisão da SERES/MEC. As sanções incluem: 8 cursos impedidos de realizar novos ingressos, 13 com redução de 50% das vagas, 33 com redução de 25%.

As privadas com fins lucrativos tiveram apenas 57,2% de proficiência. As municipais, 49,7% — abaixo do corte. As públicas federais, estaduais e privadas sem fins lucrativos tiveram os melhores resultados.

O ENAMED se tornou, literalmente, o instrumento mais poderoso que o MEC já teve para regular a qualidade do ensino médico no Brasil. E a TRI de Rasch — com toda a sua simplicidade aparente — é o motor que faz isso funcionar com transparência, reprodutibilidade e rigor.

Minha análise: por que isso importa para quem está se preparando para o ENEM

Se você é candidato ao ENEM e está lendo isso, quero que você leve três coisas:

Primeiro: “TRI” não é uma coisa só. Quando alguém diz que um simulado usa TRI, pergunte: qual modelo?

O ENEM usa 3PL. O ENAMED usa Rasch. São experiências de nota completamente diferentes. Não confunda.

Segundo: a consistência importa MUITO mais no ENEM do que no ENAMED. No ENEM, o modelo 3PL detecta e penaliza padrões inconsistentes (acertar difíceis e errar fáceis).

No ENAMED com Rasch, esse mecanismo não existe na estrutura do modelo — padrões inconsistentes são sinalizados pelo infit/outfit, mas não alteram o escore.

Então se alguém te diz que “a TRI sempre penaliza chute”, isso não é verdade para todos os modelos.

Terceiro: para quem pensa em medicina, entenda o ciclo completo. O ENEM (TRI 3PL) te coloca na universidade. O ENAMED (TRI Rasch) te avalia na saída.

E no futuro, provavelmente vai determinar se você entra ou não na residência médica via TRI — não mais por soma simples. A base técnica já foi construída.

Resumo técnico: ENEM vs ENAMED

ENEM: Modelo TRI 3PL · 3 parâmetros (a, b, c) · Itens pré-calibrados do BNI · Escala fixa (M=500, SD=100) · Comparável entre edições · Penaliza inconsistência e chute · 45 itens por área · Objetivo: ranquear para SISU

ENAMED: Modelo TRI Rasch (1PL) · 1 parâmetro (b) · Itens do BNI-ES · Escala por edição (MA=67,018, DA=17,544) · Calibragem pós-aplicação · Não modela discriminação nem chute · 100 itens totais · Objetivo: diagnosticar proficiência e avaliar cursos

Nota de corte ENAMED: θ = -0,40 → NF = 60,0 (Proficiente) · Definida pelo Angoff Modificado (57,87% de acerto esperado) · IRR = 0,894 · Painel de 20 especialistas

Para o ENARE 2025: Nota TRI NÃO vale · Critério: ≥ 50% de acertos brutos (soma simples) · Questões anuladas contam como acerto

Consideração final

Eu li as três notas técnicas do INEP. Li o documento do Ricardo Primi sobre a justificativa do modelo 1PL.

E o que eu vejo é um sistema de avaliação que está sendo construído com muito mais sofisticação do que o debate público sugere.

A escolha do Rasch não é preguiça ou simplificação — é uma decisão epistemológica fundamentada em décadas de pesquisa psicométrica, com vantagens claras para equalização entre edições e preservação da validade de conteúdo.

O ENAMED está no seu primeiro ano. Ainda vai amadurecer. Mas a base psicométrica já está sólida.

E na XTRI, nós acompanhamos cada detalhe — porque é isso que fazemos: traduzir a complexidade da TRI em conhecimento que faz diferença na vida de estudantes e instituições.

Conhecer o método é a primeira vantagem competitiva. Treinar com o método certo é a segunda.

ALEXANDRE EMERSON MELO DE ARAÚJO (XANDÃO)

XTRI – @XANDAOXTRI – @XTRIENEM

Quer entender como a TRI afeta sua nota? Acesse xtri.online e descubra sua nota real com correção TRI. Simulados, análise de padrão e mentoria ENEM baseada em Teoria de Resposta ao Item.

Fontes oficiais citadas neste artigo:
• Nota Técnica nº 42/2025/CEI/CGGI/DAES-INEP — Metodologia de cálculo das notas finais do ENAMED 2025
• Nota Técnica nº 19/2025/CGAFM/DAES-INEP — Método de Angoff Modificado para nota de corte do ENAMED 2025
• Nota técnica de justificativa em favor do modelo 1PL no ENAMED e na PND — Prof. Ricardo Primi (USF/EduLab21, Instituto Ayrton Senna)
• Portaria MEC nº 330, de 23 de abril de 2025 — Instituição do ENAMED
• Microdados ENAMED 2025 — INEP/MEC (publicados em janeiro de 2026)

Referências acadêmicas: Rasch (1960), Wright & Stone (1979), Wright (1992, 1995), Lord & Novick (1968), Bock & Aitkin (1981), Bock & Mislevy (1982), Wyse (2017), Primi & Cicchetto (2018), Bond & Fox (2015), Hambleton, Swaminathan & Rogers (1991).

Please follow and like us: