Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Lucrarea TRM pare o descoperire semnificativă a inteligenței artificiale.
Distruge granița Pareto pe benchmark-urile ARC AGI 1 și 2 (și rezolvarea Sudoku și Maze) cu un cost de < de 0,01 dolari pe sarcină și costă < 500 de dolari pentru a antrena modelul 7M pe 2 H100 timp de 2 zile.
[Specificații de instruire și testare]
Pentru ARC, s-a antrenat pe 160 de exemple de la ConceptARC. În timpul testului, folosește cel mai comun răspuns de 1000 de augmentări în timpul testului și încorporează o formă fixă a sarcinii în intrare.
[Implicații în industrie]
Majoritatea companiilor de inteligență artificială folosesc astăzi LLM-uri de uz general cu solicitare pentru sarcini. Pentru sarcini specifice, modelele mai mici pot fi nu doar mai ieftine, ci și de calitate mult mai bună! Startup-urile ar putea (și ar trebui) să antreneze modele pentru < 1000 USD pentru subsarcini specifice de "lungime fixă" (extragerea PDF-ului specific, prognoza seriilor de timp etc.) și să le folosească ca instrument pentru modelul general nu numai pentru a împinge performanța, ci și pentru a construi niște IP semnificativ la sarcina pe care încearcă să o automatizeze.

Sursă:
26,18K
Limită superioară
Clasament
Favorite