Nyt ajattelen, ettei punaista viivaa ole. 75 % luottamus: ICE voisi sanoa "demokraatit ovat terroristeja" ja lähettää 200 000 Minnesota-demokraattia keskitysleirille, tappaa 50. Republikaanit oikeuttaisivat sen, muutama edustajainhuoneen edustaja protestoi äänestystä
"Ei todellakaan se olisi sallittua" tuntuu selviytymiseltä
"Jos joku rakentaa sen, kaikki kuolevat" kuulostaa heikolta. Yud & Soares hukkasivat tilaisuuden esittää todellinen ja vahva perustelu tekoälyn x-riskille. Sen sijaan he jatkavat ilmeisten, pitkään kumottujen virheiden tekemistä, kuten "mahdollisten" tekoälytavoitteiden laskemista naiivisti
Pettymys
Kriitikkomme sanovat, että työmme tuhoaa maailman, ja monet nyt pitävät "Jos joku rakentaa sen, kaikki kuolevat" -periaatteen tekoälyn tuhon kanonisena perusteluna.
Silti kirjan argumentit ovat erittäin heikkoja. Kirja saattaa olla mielenkiintoista fiktiota, mutta se ei koskaan esitä mitään todisteita.
"Tulokseen perustuva koulutus pitää ajatusketjut rehellisinä."
Valitettavasti EI. Näytämme, että *pelkän tuloksen* harjoittelu voi silti saada mallit piilottamaan ei-toivottua käyttäytymistä ajatusketjussaan. MATS 8.0 Team Shard esittää: a 🧵