L'expérience de pensée de Karl Popper sur la "machine d'induction" anticipe beaucoup des débats épistémologiques autour de l'apprentissage par renforcement (RL) et de l'apprentissage non supervisé. Les modèles apprennent-ils des connaissances de manière inductive ? Ou dans quelle mesure leurs connaissances dépendent-elles d'une fonction de perte conçue par un humain ?