Vă prezentăm Parisul - primul model de difuzie cu greutate deschisă antrenat descentralizat din lume. L-am numit Paris după orașul care a fost întotdeauna un refugiu pentru cei care creează fără permisiune. Parisul este deschis pentru cercetare și uz comercial.
Parisul face ceva ce nu ar trebui să funcționeze. Este o combinație de modele de difuzie experte mai mici, pre-antrenate de la zero, pe diferite continente în izolare completă. Sincronizare absolut zero între ele în timpul antrenamentului. Acest protocol de comunicare zero atinge o calitate comparabilă cu abordările distribuite SOTA folosind 14× mai puține date și 16× mai puține calcule. Cum? Consultați raportul nostru tehnic complet și greutățile modelelor mai jos. Raport tehnic complet: Greutăți model:
Iată ce am făcut diferit. Antrenamentul distribuit folosește de obicei tehnici de paralelism, cum ar fi paralelismul datelor, paralelismul conductelor, paralelismul modelului etc. Toate necesită sincronizare între nodurile de calcul. Am eliminat această cerință în întregime cu Paris prin potrivirea fluxului descentralizat. După antrenament, am construit un DiTRouter ușor, de asemenea în izolare completă, care a învățat să selecteze experți la inferență pe baza unor latente zgomotoase.
Cifrele. Paris a obținut rezultate comparabile cu abordările descentralizate SOTA utilizând: Cu 14× mai puține date de antrenament (11M vs 158M imagini) 16× mai puțin calcul (120 de zile GPU A40 față de ~1176 zile A100) Paris câștigă și împotriva liniilor de bază monolitice de antrenament. Rutarea noastră din Top 2 pe DiT-B/2 atinge FID-50K de 22,60, o îmbunătățire de 7,04 puncte față de antrenamentul cu un singur model (29,64).
Rezultatele. Aceste imagini au venit de la 8 experți care nu au vorbit niciodată între ei în timpul antrenamentului. Credem că dacă putem scala această abordare, acesta este primul pas real către superinteligența open source. Dar asta necesită rezolvarea unor probleme mai grele. Dacă ești interesat să ne ajuți să realizăm acest lucru în timp ce faci cea mai bună muncă open-source din viața ta, vino să lucrezi cu noi,
523,59K