Nous estimons que Kimi K2 Thinking a un horizon temporel de 50 % d'environ 54 minutes (intervalle de confiance à 95 % de 25 à 100 minutes) sur nos tâches SWE agentiques. Notez que nous avons réalisé cette évaluation par l'intermédiaire d'un fournisseur d'inférence tiers, ce qui réduit notre confiance dans cette estimation.