這是一個很好的觀點,顯示了世界模型因缺乏記憶而受到限制,以及記憶以低效且昂貴的格式(包含像素的視頻幀)存在的事實。 理想的記憶應該是什麼樣的呢?它本質上應該是一個場景圖(James Clark,1976年!),以層次化的方式描述世界中所有物體及其屬性,並且易於查詢和操作。 這就是核心論點的原因,即理想的進化路徑看到世界模型和引擎的合併,AI 方面提供大量鬆散組織的視聽和文本知識,而引擎則提供一致的可重複數據表示和模擬。