Une grande partie de la vague actuelle des modèles ouverts d'IA repose sur des ensembles de données et des éléments de base conçus et publiés par l'équipe scientifique de @huggingface : FineWeb, SmolTalk, recettes, etc. Un travail discret - un impact massif