Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Nous Research esittelee Hermes 4:n, uusimman hybridipäättelymallisarjamme.
Hermes 4 perustuu käyttäjäkohtaisten mallien perintöön, jossa on laajennetut testiaikaiset laskentaominaisuudet.
Erityistä huomiota kiinnitettiin siihen, että mallit olisivat luovia ja mielenkiintoisia vuorovaikutuksessa, joita ei rasita sensuuri ja jotka ovat neutraalisti linjassa säilyttäen samalla huipputason matematiikan, koodauksen ja päättelyn suorituskyvyn avoimissa painomalleissa.

10,87K
Nous Research kirjasi uudelleen
1/10🧵 @nousresearch julkaisi äskettäin mielenkiintoisen tutkimuksen, joka osoittaa, että avoimet mallit käyttävät 2-3 kertaa enemmän tokeneita kuin suljetut mallit päättelytehtäviin.
Testasimme voisiko dynaaminen token-allokaatio auttaa korjaamaan tätä tehokkuusvajetta. Tässä on mitä opimme 👇
8,06K
Ajattelun tehokkuuden mittaaminen päättelymalleissa: Puuttuva vertailukohta
Mittasimme tokenien käyttöä eri päättelymalleissa: avoimet mallit tuottavat 1,5–4 kertaa enemmän tokeneita kuin suljetut mallit identtisissä tehtävissä, mutta varianssi on valtava tehtävätyypistä riippuen (jopa 10 kertaa yksinkertaisissa kysymyksissä).
Nämä piilokustannukset kumoavat usein token-kohtaiset hinnoitteluedut. Tokenien tehokkuudesta tulisi tulla ensisijainen tavoite tarkkuusvertailuarvojen rinnalla, erityisesti kun otetaan huomioon ei-järkeilevät käyttötapaukset.
Lue perusteellinen katsaus päättelyn tehokkuudesta avoimen ja suljetun mallin maisemassa uusimmasta blogikirjoituksestamme yhteistyössä residenssitutkijamme Timin kanssa.
Katso lisää heidän töistään täältä:

48,78K
Nous Research kirjasi uudelleen
Arena-Hard eval -ympäristö on nyt yhdistetty Atroposiin - nauti skaalautuvasta, joustavasta ja modernista arvioinnista @lmsysorg:n areena-hard-vertailuarvolla, joka on erittäin hyvä määrittämään laajan valikoiman malleja.
Valmis RL-ympäristöksi, jos tuot oman junasarjan myös :)
Lue lisää osoitteesta

6,99K
Residenssitutkijamme @yaboilyrical keskustelee työstään SMC-ohjauksen parissa UC Berkeleyssä 3. elokuuta.
Tutustu tämän teoksen blogiin täältä:
Yksityiskohdat alla!

nightwing25.7.2025
Innoissani voidessani ilmoittaa, että olen puhujana @BerkeleyRDI DeAI Summitissa ja esittelen tutkimustani @NousResearch rajoitetun kielen dekoodauksesta!
Jos osallistut huippukokoukseen tai haluat tulla katsomaan puhettani, ota minuun yhteyttä!

11,04K
Johtavat
Rankkaus
Suosikit