在我看來,這個結果最重要的啟示是,我們的 @OpenAI 國際數學奧林匹克(IMO)金牌模型也是我們最好的競爭編碼模型。🧵
Sheryl Hsu
Sheryl Hsu8月12日 02:00
1/n 我很高興地分享,我們的 @OpenAI 推理系統在全球頂尖的程式設計競賽之一——2025年國際資訊奧林匹亞(IOI)中獲得了足夠高的分數,獲得金獎 🥇🥇,在 AI 參賽者中名列第一! 👨‍💻👨‍💻
在IMO之後,我們對IMO金模型進行了全面評估,發現除了競爭數學之外,它在許多其他領域,包括編碼方面,也是我們最好的模型。因此,大家決定不做任何改動,直接使用相同的IMO金模型,並將其應用於IOI系統中。
IOI支架涉及從幾個不同的模型中取樣,然後使用另一個模型和啟發式方法來選擇提交的解決方案。這個系統獲得了金牌,在人類中排名第六。IMO金牌模型確實是我們取樣的所有模型中表現最好的。
為了澄清,這個系統使用了支架,雖然比去年輕一些。它僅決定從通用模型中提交哪些樣本。我對明年感到樂觀,我們會相信模型本身能做得比我們能想到的任何支架更好。
我並未參與這項工作。恭喜 @sherylhsu02、@alexwei_、@bminaiev 和 oleg murk,以及 @_lorenzkuhn、@MostafaRohani、@clavera_i、@andresnds、@ahelkky 和其他許多人取得這個成果!
155.73K