Ich denke jetzt, dass es keine rote Linie gibt. 75% Vertrauen: ICE könnte sagen "Dems sind Terroristen" und 200.000 Minnesota-Dems in ein Konzentrationslager schicken, 50 töten. Die Republikaner würden es rationalisieren, ein paar Abgeordnete im Repräsentantenhaus würden gegenstimmen.
"So etwas würde nicht erlaubt sein" fühlt sich an wie eine Ausrede.
"Wenn jemand es baut, sterben alle" scheint schwach zu sein. Yud und Soares haben eine Gelegenheit verpasst, einen echten, starken Fall für AI x-risk zu machen. Stattdessen machen sie weiterhin offensichtliche, längst widerlegte Fehler, wie naiv "mögliche" AI-Ziele zu zählen.
Enttäuschend
Our critics say our work will destroy the world, and many now point to "If Anyone Builds It, Everyone Dies" as the canonical case for AI doom.
Yet we find the book's arguments extremely weak. The book might make for interesting fiction, but it never presents any evidence.
„Ausgabeorientiertes Training wird die Gedankengänge ehrlich halten.“
Leider NEIN. Wir zeigen, dass das Training nur auf *der Ausgabe* Modelle dazu bringen kann, unerwünschtes Verhalten in ihrem Gedankengang zu verbergen. MATS 8.0 Team Shard präsentiert: ein 🧵