разобрался, как "отменить" RL и вернуть gpt-oss обратно в базовую модель завтра выложу веса спокойной ночи
jack morris
jack morris9 авг., 03:21
интересно, какие данные использовались для обучения новых моделей gpt-oss от OpenAI? Я тоже был в этом заинтересован. Поэтому я сгенерировал 10 миллионов примеров из gpt-oss-20b, провел некоторый анализ, и результаты были... довольно странными. Время для глубокого погружения 🧵
195,31K