これは非常に良い指摘であり、ワールドモデルがメモリ不足や、メモリが非効率で高価なフォーマット(ピクセルを含むビデオフレーム)であることによって制限されていることを示しています。 理想的な記憶とはどのようなものでしょうか?本質的にはシーングラフ(ジェームズ・クラーク、1976年!)で、世界内のすべてのオブジェクトとその特性を階層的に記述し、クエリや操作が容易になる形で説明するものになるでしょう。 これが、理想的な進化の道筋は世界モデルとエンジンの融合、AI側が膨大でゆるやかに整理された視聴覚・テキスト知識を提供し、エンジンが一貫した再現可能なデータ表現とシミュレーションを提供することを目指すという核心的な主張の理由です。