¿Tienes una Mac con un chip M? Ahora puede entrenar Gemma3 270m localmente como un modelo de incrustación o reclasificación multilingüe utilizando nuestro proyecto mlx-retrieval. Te permite entrenar a Gemma3 270m localmente a 4000 tokens/s en M3 Ultra, eso es realmente velocidad utilizable. Hemos implementado algunas prácticas estándar para entrenar un modelo eficaz de incrustación o reranker solo de decodificador con MLX: LoRA completo/parcial, InfoNCE, acumulación de gradiente y cargador de datos de transmisión. Además de la integración de MTEB para bucles de evaluación de trenes.
28.92K