La solución era en realidad bastante simple: Con un interruptor en la intención + una solicitud HTTP, el agente puede determinar la forma óptima de recuperar información. Solo recurre al uso completo del navegador visual si es necesario. Reduce el uso de tokens en un ~80%. Un rápido benchmark: