Ich denke, Sutton hat in fast allem recht. Nachahmung bei Tieren ist keine Nachahmung. Es ist ein Ziel, nachzuahmen, und die *motorischen Aktionen* werden ohne Daten erlernt. Der Starling kann die motorischen Aktionen nicht nachahmen, er sieht sie nicht. Es ist ein Ziel, nachzuahmen.
Es ist sehr schwer, die Leute dazu zu bringen, das zu verstehen Und übrigens, sag nicht, dass LLMs RL verwenden Sie verwenden RL nicht in ihrem Leben Es ist auf dem Weg dorthin, und weiterzugehen beweist nur, dass seine Meinung mehr recht hat
LLMs sind übrigens schlecht, was die bittere Lektion betrifft, denn sie sind im Grunde das Gegenteil von Rechenmultiplikatoren. Ich versuche, euch zu helfen, das zu verstehen.
@bftnad er muss immer noch herausfinden, lernen und erkunden, wie man die tatsächlichen Motorbefehle erstellt
123,98K