생산성을 위해 AI 에이전트를 풀어놨더니 토큰 청구서가 공포물이 됐다
예전의 나는 거대한 토큰 청구서를 보면 AI 스택이 분명 엄청난 일을 하고 있다고 생각했다. 호출이 많고, 추론이 많고, 자동화가 많고, 가치도 많다. 그런 환상이었다. 현실은 더 추하다. 많은 에이전트 세팅에서 폭증하는 토큰 사용량은 지능의 증거가 아니다. 시스템이 루프를 돌고, 재시도하고, 자기 자신을 의심하고, 컨텍스트를 다시 불러오고, 뒤에서 조용히 돈을 태우고 있다는 증거다. 그런데도 사람들은 대시보드를 보며 그걸 진보라고 믿고 싶어 한다. 더 썩은 느낌이 드는 건 지금 일부 팀이 그 상태를 말하는 방식이다. 더 큰 토큰 실행. 더 큰 컨텍스트 윈도우. 더 큰 에이전트 추적 로그. 더 큰 사내 랭킹. 더 큰 예산. 하지만 원래 단순했어야 할 일을 끝내기 위해 한 에이전트가 도구 호출의 미로, 재시도, 검증기, 자기반성 루프를 필요로 한다면, 그건 생산성이 아니다. 그건 포장만 좋아진 낭비다.