Soltamos agentes de IA por “productividad” y la factura de tokens se volvió una historia de terror
Antes yo pensaba que una factura enorme de tokens significaba que el stack de IA debía de estar haciendo trabajo serio. Más llamadas, más razonamiento, más automatización, más valor. Esa era la fantasía. La realidad es más fea. En muchas configuraciones con agentes, el uso explosivo de tokens no demuestra inteligencia. Demuestra que el sistema está entrando en bucles, reintentando, dudando de sí mismo, recargando contexto y quemando dinero en silencio mientras todos fingen que el dashboard significa progreso. Lo que hizo que esto se sintiera realmente podrido fue ver cómo algunos equipos hablan ahora de ello. Ejecuciones de tokens más grandes. Ventanas de contexto más grandes. Trazas de agentes más grandes. Rankings internos más grandes. Presupuestos más grandes. Pero si un agente necesita un laberinto de llamadas a herramientas, reintentos, validadores y bucles de autorreflexión para terminar algo que debería haber sido simple, eso no es productividad. Es desperdicio con mejor branding.