アンドリュー・ンは研究論文のための「エージェントティック・レビュアー」を発表しました。 実際のICLR 2025レビューのトレーニングを経て、ほぼ人間レベルの合意に達しました。 その問題は 論文の審査は遅いです。 各サイクルは約6か月かかります。 ある学生は3年間で6回の不合格通知を受けました。 アイデアではなく反復速度がボトルネックとなりました。 仕組み システムは実際の会議からのフィードバックから学習します。 論文を読み、関連する研究をarXivで検索します。 流れはシンプルです: 請求と構造の分析 発表された研究におけるグラウンドコメント 構造化されたレビュアースタイルのフィードバックを作成する オープンな文献がある分野で最も効果的です。 なんて素晴らしいことか ヒト・トゥ・ヒトレビューの相関は0.41です。 AIと人間の相関は0.42に達します。 これは今日の査読者合意に近い数字です。
リンク:
51