Do meu ponto de vista, rl é apenas uma forma mais tolerável de dizer dados sintéticos, que ninguém gostava há dois anos, quando comecei a fazer amostragem de rejeição para criar o Hermes 1. Dados sintéticos (incluindo dados semi-sintéticos) têm sido o presente desde que o ChatGPT foi lançado.