Estimamos que Kimi K2 Thinking tiene un horizonte temporal del 50% de alrededor de 54 minutos (intervalo de confianza del 95% de 25 a 100 minutos) en nuestras tareas de SWE agente. Cabe señalar que realizamos esta evaluación a través de un proveedor externo de inferencia, lo que reduce nuestra confianza en esta estimación.