Andrew Ng lançou um "Revisor Agente" para artigos de pesquisa. Ele acabou de alcançar um acordo próximo ao nível humano após treinar com revisões reais do ICLR 2025. 𝗢 𝗽𝗿𝗼𝗯𝗹𝗲𝗺 𝗾𝘂𝗲 𝗲𝗹𝗲 𝘁𝗮𝗿𝗴𝗲𝘁𝗮 A revisão de artigos é lenta. Cada ciclo leva cerca de seis meses. Um estudante viu seis rejeições ao longo de três anos. A velocidade de iteração, e não as ideias, tornou-se o gargalo. 𝗖𝗼𝗺𝗼 𝗲𝗹𝗲 𝗮𝗰𝘁𝘂𝗮 O sistema aprende com feedback real de conferências. Ele lê seu artigo e, em seguida, busca no arXiv por trabalhos relacionados. O fluxo é simples: Analisar reivindicações e estrutura Basear comentários em pesquisas publicadas Produzir feedback estruturado no estilo de revisor Funciona melhor em campos com literatura aberta. 𝗖𝗼𝗺𝗼 𝗲́ 𝗳𝗼𝗻𝗱𝗮𝗺𝗲𝗻𝘁𝗮𝗹 A correlação de revisão humano-a-humano está em 0.41. A correlação AI-a-humano atinge 0.42. Isso está próximo do acordo de revisores hoje.
Link:
95