Báo cáo công nghệ Kimi K2.5 vừa được phát hành! Những điểm nổi bật: - Đào tạo văn bản-hình ảnh chung: được tiền huấn luyện với 15T token văn bản-hình ảnh, SFT không hình ảnh (chỉ văn bản) để kích hoạt lý luận hình ảnh - Agent Swarm + PARL: các tác nhân phụ song song được điều phối động, độ trễ thấp hơn tới 4.5×, 78.4% trên BrowseComp - MoonViT-3D: một bộ mã hóa hình ảnh-video thống nhất với nén tạm thời 4×, cho phép video dài hơn 4× trong cùng một ngữ cảnh - Toggle: RL hiệu quả token, giảm 25–30% số token mà không giảm độ chính xác Đây là công việc của chúng tôi hướng tới trí thông minh tác nhân có thể mở rộng trong thế giới thực. Thêm chi tiết trong báo cáo 👉