一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

在我看來，這個結果最重要的啟示是，我們的 @OpenAI 國際數學奧林匹克（IMO）金牌模型也是我們最好的競爭編碼模型。🧵

在IMO之後，我們對IMO金模型進行了全面評估，發現除了競爭數學之外，它在許多其他領域，包括編碼方面，也是我們最好的模型。因此，大家決定不做任何改動，直接使用相同的IMO金模型，並將其應用於IOI系統中。

IOI支架涉及從幾個不同的模型中取樣，然後使用另一個模型和啟發式方法來選擇提交的解決方案。這個系統獲得了金牌，在人類中排名第六。IMO金牌模型確實是我們取樣的所有模型中表現最好的。

為了澄清，這個系統使用了支架，雖然比去年輕一些。它僅決定從通用模型中提交哪些樣本。我對明年感到樂觀，我們會相信模型本身能做得比我們能想到的任何支架更好。

我並未參與這項工作。恭喜 @sherylhsu02、@alexwei_、@bminaiev 和 oleg murk，以及 @_lorenzkuhn、@MostafaRohani、@clavera_i、@andresnds、@ahelkky 和其他許多人取得這個成果！

155.73K