Til tross for all snakk om AI-tilpasning, er jeg redd for at vi setter vognen foran hesten. Du kan ikke styre noe du ikke kan kontrollere. Folk snakker ofte om inneslutning og justering i samme åndedrag, men de er ikke utskiftbare eller en pakke. Inneslutning er om vi kan sette grenser, håndheve dem og begrense dens handlekraft. Alignment handler om å sikre at den deler våre verdier, at den tjener menneskers beste interesser. Inneslutning må komme først – ellers er alignment det samme som å be pent.