We schatten dat Kimi K2 Thinking een 50%-tijdshorizon heeft van ongeveer 54 minuten (95% betrouwbaarheidsinterval van 25 tot 100 minuten) voor onze agentische SWE-taken. Let op dat we deze evaluatie hebben uitgevoerd via een derde partij inferentieprovider, wat ons vertrouwen in deze schatting vermindert.