Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Apresentando Paris - o primeiro modelo de difusão de peso aberto descentralizado e treinado do mundo.
Demos o nome de Paris em homenagem à cidade que sempre foi um refúgio para quem cria sem permissão.
Paris está aberta para pesquisa e uso comercial.
Paris faz algo que não deveria funcionar.
É uma combinação de modelos de difusão especializados menores pré-treinados do zero, em diferentes continentes em completo isolamento. Sincronização absolutamente zero entre si durante o treinamento.
Este protocolo de comunicação zero alcança qualidade comparável às abordagens distribuídas SOTA usando 14× menos dados e 16× menos computação.
Como? Veja nosso relatório técnico completo e pesos de modelo abaixo.
Relatório técnico completo:
Pesos do modelo:

Aqui está o que fizemos de diferente.
O treinamento distribuído normalmente usa técnicas de paralelismo, como paralelismo de dados, paralelismo de pipeline, paralelismo de modelo etc. Todos exigem sincronização entre nós de computação. Removemos esse requisito inteiramente com Paris por meio de correspondência de fluxo descentralizada.
Após o treinamento, construímos um DiTRouter leve, também em completo isolamento, que aprendeu a selecionar especialistas em inferência com base em latentes ruidosos.

Os números.
Paris alcançou resultados comparáveis às abordagens descentralizadas da SOTA ao usar:
14× menos dados de treino (11M vs 158M imagens)
16× menos computação (120 A40 GPU-dia vs ~1176 A100-dias)
Paris também vence contra linhas de base de treinamento monolíticas. Nosso roteamento Top-2 no DiT-B/2 atinge o FID-50K de 22,60, uma melhoria de 7,04 pontos em relação ao treinamento de modelo único (29,64).


Os resultados.
Essas imagens vieram de 8 especialistas que nunca se falaram durante o treinamento.
Acreditamos que, se pudermos dimensionar essa abordagem, este será o primeiro passo real em direção à superinteligência de código aberto. Mas isso requer a resolução de alguns problemas mais realmente difíceis. Se você estiver interessado em nos ajudar a conseguir isso enquanto faz o melhor trabalho de código aberto da sua vida, venha trabalhar conosco,

523,68K
Melhores
Classificação
Favoritos

