O relatório técnico do Kimi K2.5 acabou de cair! Golpes rápidos: - Treinamento conjunto texto–visão: pré-treinado com tokens de visão-texto 15T, SFT de visão zero (apenas texto) para ativar o raciocínio visual - Enxame de Agentes + PARL: subagentes paralelos orquestrados dinamicamente, até 4,5× menor latência, 78,4% no BrowseComp - MoonViT-3D: um codificador unificado imagem–vídeo com compressão temporal de 4×, permitindo vídeos de 4× mais longos no mesmo contexto - Toggle: RL eficiente em tokens, 25–30% menos tokens sem queda de precisão Aqui está nosso trabalho rumo a uma inteligência agente escalável e real. Mais detalhes no relatório 👉