Büyük ölçekli sentetik bir veri seti yayınlıyoruz: 💬FineTranslations. 🥂 Çok dilli ön eğitim veri setimiz olan FineWeb2'yi aldık ve Gemma3 27B kullanarak İngilizceye çevirdik. Sonuç, 1 trilyondan fazla tokena sahip devasa bir paralel korporatif ortaya çıktı!