Trots allt prat om AI-alignment oroar jag mig för att vi sätter vagnen före hästen. Du kan inte styra något du inte kan kontrollera. Folk pratar ofta om inneslutning och samordning i samma andetag, men de är inte utbytbara eller ett paket. Inneslutning handlar om huruvida vi kan sätta gränser, upprätthålla dem och begränsa dess handlingskraft. Alignment handlar om att säkerställa att den delar våra värderingar, att den tjänar människors bästa intressen. Inneslutning måste komma först – annars är alignment som att be snällt.