Theo quan điểm của tôi, rl chỉ là một cách dễ chịu hơn để nói về dữ liệu tổng hợp mà mọi người không thích cách đây hai năm khi tôi bắt đầu thực hiện lấy mẫu từ chối để tạo ra Hermes 1. Dữ liệu tổng hợp (bao gồm dữ liệu bán tổng hợp) đã hiện hữu kể từ khi ChatGPT ra mắt.