أعتقد الآن أنه لا يوجد خط أحمر. ثقة 75٪: يمكن لإدارة الهجرة والجمارك أن تقول "الديمقراطيون إرهابيون" وتشحن 200 ألف ديمقراطي من مينيسوتا إلى معسكر اعتقال، وتقتل 50. الجمهوريون سيبررون الأمر، حيث يصوت بعض نواب مجلس النواب على احتجاج.
"مستحيل أن يسمح بذلك" يشعر وكأنه تكيف
"إذا بناها أحد، يموت الجميع" تبدو ضعيفة. أضاع يود وسواريس فرصة لتقديم حجة قوية وحقيقية لخطر الذكاء الاصطناعي السيء. بدلا من ذلك، يستمرون في ارتكاب أخطاء واضحة تم دحضها منذ زمن طويل، مثل عد الأهداف الذكاء الاصطناعي "المحتملة" بسذاجة
مخيب
يقول منتقدونا إن عملنا سيدمر العالم، ويشير الكثيرون الآن إلى "إذا بناه أحد، يموت الجميع" كحجة رسمية لكارثة الذكاء الاصطناعي.
ومع ذلك، نجد حجج الكتاب ضعيفة للغاية. قد يكون الكتاب خيالا مثيرا للاهتمام، لكنه لا يقدم أي دليل.
"التدريب القائم على النتائج سيبقي سلاسل الأفكار صادقة."
للأسف، لا. نظهر أن التدريب على *المخرجات فقط* لا يزال يمكن أن يجعل النماذج تخفي سلوكا غير مرغوب فيه في سلسلة أفكارها. فريق شارد من ماتس 8.0 يقدم: 🧵