DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Medgrundarna av @flappyairplanes kallar det nuvarande RL-paradigmet för modellträning för "miljöslop." De förklarar: "Dagens förstärkningsparadigm är chockerande ineffektiva. Du får egentligen inte mycket generalisering mellan uppgifter, du lär ut en modell genom en typ av lärande och sedan lär du ut nästa. Det är lite som whack-a-mole. Vi tittar på det här och tycker att det är lite galet. Nästa paradigm för AI kommer inte att vara miljösladd." "Mänsklig intelligens är inte taket, det är bara golvet för vad som är möjligt. Om du kan träna modeller med mycket mindre data och möjligen mer beräkning på mycket olika sätt, vad kommer då att hända? Vi vet faktiskt inte. Men jag tror att de kommer att vara annorlunda och konstiga och de kommer att ha intressanta förmågor som vi kommer att hitta riktigt värdefulla sätt att använda."

Topp

Rankning

Favoriter