نحن نصدر مجموعة بيانات تركيبية واسعة النطاق: 💬FineTranslations. أخذنا 🥂 FineWeb2، مجموعة بيانات التدريب المسبق متعددة اللغات، وترجمناها إلى الإنجليزية باستخدام Gemma3 27B. والنتيجة هي مجموعة ضخمة موازية، تضم أكثر من تريليون رمز!