卡爾·波普的「歸納機器」思想實驗預示了許多關於強化學習和無監督學習的認識論辯論。 模型是以歸納方式學習知識嗎?還是它們的知識在多大程度上依賴於人類設計的損失函數?