Мыслительный эксперимент Карла Поппера о "индукционной машине" предвосхищает многие эпистемологические дебаты вокруг RL и неконтролируемого обучения. Модели учат знания индуктивно? Или в какой степени их знания зависят от функции потерь, разработанной человеком?