Vydáváme rozsáhlou syntetickou datovou sadu: 💬FineTranslations. Vzali 🥂 jsme FineWeb2, náš vícejazyčný předtréninkový dataset, a přeložili ho do angličtiny pomocí Gemma3 27B. Výsledkem je masivní paralelní korpus s více než 1 bilionem tokenů!