關於 AI 對齊的討論,我擔心我們把馬車放在了馬前面。你無法駕駛你無法控制的東西。 人們經常把遏制和對齊放在一起談論,但它們並不是可以互換的或捆綁在一起的交易。 遏制是我們是否能夠設置邊界、執行它們並限制其行動能力。對齊則是確保它分享我們的價值觀,為人類的最佳利益服務。 遏制必須先行——否則對齊就等於是禮貌地請求。