熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
Andrew Ng 發布了一個“代理評審者”用於研究論文。
它在真實的 ICLR 2025 評論上訓練後,達到了接近人類水平的協議。
𝗧𝗵𝗲 𝗽𝗿𝗼𝗯𝗹𝗲𝗺 𝗶𝘁 𝘁𝗮𝗿𝗴𝗲𝘁𝘀
論文評審進展緩慢。
每個周期大約需要六個月。
一位學生在三年內遭遇了六次拒絕。
迭代速度,而不是想法,成為了瓶頸。
𝗛𝗼𝘄 𝗶𝘁 𝘄𝗼𝗿𝗸𝘀
該系統從真實的會議反饋中學習。
它閱讀你的論文,然後在 arXiv 上搜索相關工作。
流程很簡單:
分析主張和結構
將評論基於已發表的研究
產生結構化的評審風格反饋
在開放文獻的領域中效果最佳。
𝗛𝗼𝘄 𝗴𝗼𝗼𝗱 𝗶𝘁 𝗶𝘀
人與人之間的評審相關性為 0.41。
AI 與人之間的相關性達到 0.42。
這接近今天的評審一致性。

連結:
83
熱門
排行
收藏
