卡尔·波普尔的“归纳机器”思想实验预示了许多关于强化学习和无监督学习的认识论辩论。 模型是以归纳方式学习知识吗?或者说,它们的知识在多大程度上依赖于人类设计的损失函数?