Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
A mio avviso, il risultato più importante di questo risultato è che il nostro modello d'oro dell'@OpenAI International Math Olympiad (IMO) è anche il nostro miglior modello di coding competitivo. 🧵

12 ago, 02:00
1/n Sono entusiasta di condividere che il nostro sistema di ragionamento @OpenAI ha ottenuto un punteggio sufficientemente alto per raggiungere l'oro 🥇🥇 in una delle competizioni di programmazione più prestigiose al mondo - la 2025 International Olympiad in Informatics (IOI) - classificandosi primo tra i partecipanti AI! 👨💻👨💻

Dopo l'IMO, abbiamo eseguito valutazioni complete sul modello gold dell'IMO e abbiamo scoperto che, oltre alla semplice matematica competitiva, era anche il nostro miglior modello in molte altre aree, inclusa la programmazione. Quindi, le persone hanno deciso di prendere lo stesso identico modello gold dell'IMO, senza alcuna modifica, e utilizzarlo nel sistema per l'IOI.
Il ponte IOI prevedeva il campionamento da alcuni modelli diversi e poi l'uso di un altro modello e di un'euristica per selezionare le soluzioni da inviare. Questo sistema ha ottenuto una medaglia d'oro, piazzandosi al 6° posto tra gli esseri umani. Il modello d'oro dell'IMO ha effettivamente ottenuto i migliori risultati tra tutti i modelli da cui abbiamo campionato.
Per essere chiari, questo sistema ha utilizzato un'impalcatura, sebbene più leggera rispetto all'anno scorso. Ha solo deciso quali campioni di modelli generali inviare. Sono ottimista che l'anno prossimo ci sentiremo sicuri che il modello stesso possa fare meglio di qualsiasi impalcatura che potremmo inventare.
Non sono stato coinvolto in questo lavoro. Grandi congratulazioni a @sherylhsu02, @alexwei_, @bminaiev e oleg murk, così come a @_lorenzkuhn, @MostafaRohani, @clavera_i, @andresnds, @ahelkky e a molti altri per questo risultato!
155,77K
Principali
Ranking
Preferiti