这是一个很好的观点,表明世界模型受到记忆缺乏的限制,以及记忆以低效且昂贵的格式(包含像素的视频帧)存在的事实。 理想的记忆应该是什么样的呢?它本质上应该是一个场景图(James Clark,1976年!),以层次结构描述世界中所有对象及其属性,以便于查询和操作。 这就是核心论点的原因,即理想的进化路径看到世界模型和引擎的合并,AI 方面提供大量松散组织的视听和文本知识,而引擎则提供一致的可重复数据表示和仿真。