Aus meiner Sicht ist rl einfach eine tolerantere Art, synthetische Daten zu sagen, die vor zwei Jahren, als ich mit dem Ablehnungs-Sampling begann, um Hermes 1 zu erstellen, bei dem niemand ein Fan war. Synthetische Daten (einschließlich halb-synthetischer Daten) sind seit dem Erscheinen von ChatGPT präsent.