生産性のためにAIエージェントを野放しにしたら、トークン請求がホラーになった
昔の私は、巨大なトークン請求書を見れば「AIスタックは相当ちゃんと仕事をしているに違いない」と思っていました。呼び出しが多い、推論が多い、自動化が多い、価値も多い。そういう幻想です。現実はもっと醜い。多くのエージェント運用では、トークン使用量の爆発は知性の証拠ではありません。システムがループし、再試行し、自分を疑い、コンテキストを読み直し、裏で静かに金を燃やしている証拠です。それなのに、みんなダッシュボードを見て進歩だと信じたがる。 さらに嫌なのは、いま一部のチームがその状態をどう語っているかです。より大きなトークン実行。より大きなコンテキストウィンドウ。より大きなエージェントトレース。より大きな社内ランキング。より大きな予算。けれど、もし一つのエージェントが、本来なら単純であるはずの仕事を終わらせるために、道具呼び出しの迷路、再試行、バリデーター、自己反省ループを必要としているなら、それは生産性ではありません。ブランド名を与えられた浪費です。