Auch wenn ich nicht sage, dass dieser Kreislauf der Selbstverbesserung letztendlich nicht funktionieren kann, denke ich, dass wir noch nicht "Fluchtgeschwindigkeit" erreicht haben. Die LLMs sind derzeit nicht ausreichend "ehrlich", insbesondere wenn der Optimierungsdruck angewendet wird, um nicht dem Zusammenbruch zu erliegen. Bis dahin haben wir genau eine N=1 Stichprobengröße von Dingen, die zuverlässig eine vielfältige Reihe von emergenten Fähigkeiten verleihen: das Pre-Training. Die Leute sollten weniger Zeit damit verbringen, über das Post-Training nachzudenken, und mehr Zeit damit, über Dinge nachzudenken, die effektiv wie Pre-Training aussehen, aber unterschiedliche Versprechungen halten könnten.