Andrew Ng 發布了一個“代理評審者”用於研究論文。 它在真實的 ICLR 2025 評論上訓練後,達到了接近人類水平的協議。 𝗧𝗵𝗲 𝗽𝗿𝗼𝗯𝗹𝗲𝗺 𝗶𝘁 𝘁𝗮𝗿𝗴𝗲𝘁𝘀 論文評審進展緩慢。 每個周期大約需要六個月。 一位學生在三年內遭遇了六次拒絕。 迭代速度,而不是想法,成為了瓶頸。 𝗛𝗼𝘄 𝗶𝘁 𝘄𝗼𝗿𝗸𝘀 該系統從真實的會議反饋中學習。 它閱讀你的論文,然後在 arXiv 上搜索相關工作。 流程很簡單: 分析主張和結構 將評論基於已發表的研究 產生結構化的評審風格反饋 在開放文獻的領域中效果最佳。 𝗛𝗼𝘄 𝗴𝗼𝗼𝗱 𝗶𝘁 𝗶𝘀 人與人之間的評審相關性為 0.41。 AI 與人之間的相關性達到 0.42。 這接近今天的評審一致性。
連結:
83