DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

De mede-oprichters van @flappyairplanes noemen het huidige RL-paradigma voor modeltraining "environment slop." Ze leggen uit: "De versterkingsparadigma's van vandaag zijn schokkend inefficiënt. Je krijgt niet echt veel generalisatie over taken, je leert een model door één soort leren en dan leer je het de volgende. Het is een beetje als whack-a-mole. We kijken hiernaar en denken dat het een beetje gek is. Het volgende paradigma van AI zal geen environment slop zijn." "Menselijk niveau intelligentie is niet het plafond, het is slechts de vloer van wat mogelijk is. Als je modellen kunt trainen met veel minder data en mogelijk meer rekenkracht op heel andere manieren, wat gaat er dan gebeuren? We weten het eigenlijk niet. Maar ik denk dat ze anders en vreemd zullen zijn en dat ze interessante mogelijkheden zullen hebben die we op echt waardevolle manieren zullen gebruiken."

Boven

Positie

Favorieten