Resumo:
Este estudo verifica a viabilidade do uso de Modelos de Linguagem(LLMs) como avaliadores automáticos, sob o paradigma “LLM-as-a-Judge”, para a correção de redações do Exame Nacional do EnsinoMédio (ENEM). A pesquisa compara sistematicamente a qualidade daavaliação, a consistência, a latência e o custo computacional de cincomodelos distintos, submetidos a um protocolo reprodutível. Foiempregado um prompt único e estável, projetado para instruir osmodelos a aplicarem estritamente a rubrica oficial do exame,desdobrada nas cinco competências (C1 a C5). A avaliação foiconduzida sobre um corpus público de redações com nota máxima(1.000 pontos) nas edições de 2022 a 2024 do ENEM, utilizando umsistema automatizado para a coleta padronizada de métricas dedesempenho e validações da conformidade das saídas.
Referência:
ASSUMPÇÃO, Heitor Dutra de; BRITO, Adriana Camargo de. Seleção de modelo de linguagem de redações do Enem. Estratégias & Soluções, dez., 2025. [on-line]
Acesso ao artigo no site do Perioódico: