정액 요금제로 에이전트를 돌릴 수 없는 이유

한동안 나는 월 정액 구독 하나로 openclaw 기반 AI 에이전트를 24시간 돌렸다. 홈서버에 올려두고, 자는 동안에도 일을 시켰다.

싸고 좋았다. 오래 못 갈 거라는 것만 빼면.

얼마 전 그 길이 막혔다. Anthropic이 정액 구독으로 외부 도구를 돌리는 걸 차단했다.
구독 인증은 이제 Claude.ai나 Claude Code 같은 공식 도구에서만 허용된다.
OpenClaw 같은 에이전트 프레임워크가 첫 대상이었다.

“또 플랫폼이 빗장을 걸었다”고 보면 그냥 뉴스다. 한 번 지나가면 끝이다.
그런데 내가 궁금했던 건 다른 거였다. 이게 왜 처음부터 지속될 수 없는 구조였나.

정액제가 사는 것

정액제 가격은 한 가지 전제 위에 매겨진다. 사람이 사람처럼 쓴다는 것.

월 2만 원, 20만 원 같은 가격은 “하루에 몇 번 대화한다”를 기준으로 짜였다.
많이 쓰는 사람은 적게 쓰는 사람이 떠받는다. 헬스장 무제한 회원권과 같다.
매일 가는 소수를, 등록만 하고 안 가는 다수가 보조한다.

이게 성립하려면 조건이 하나 필요하다. 많이 쓰는 사람도 결국 사람의 한계 안에서 쓴다는 것.

에이전트가 깨는 것

에이전트는 그 전제를 깬다.

직접 보면 분명하다.

에이전트가 작업 하나를 처리하는 데 모델 호출이 3~8번 일어난다.
생각하고, 도구를 고르고, 실행하고, 결과를 보고, 다시 고른다. 그때마다 그동안의 대화가 통째로 다시 들어간다.

거기에 정해진 시간마다 스스로 깨어나 상황을 보는 기능까지 붙이면, 내가 한 글자도 안 쳐도 토큰이 나간다.
30분에 한 번이면 하루 48번, 한 달이면 1,400번이 넘는다.

내 경우 어떤 달은 종량으로 환산하니 월 500달러 수준이었다. 정액은 200달러였다.

게다가 얼마를 쓸지 미리 알 수도 없다. LLM은 같은 걸 시켜도 매번 답이 조금씩 다르다. 결정론적이지 않다는 뜻이다. 답이 달라지면 거치는 단계도, 먹는 토큰도 달라진다. 같은 일을 어떤 날은 두 번에 끝내고, 어떤 날은 다섯 번을 돌다. 결국 월말이 돼서야 얼마 나왔는지 안다.

나만 그런 게 아니다. 종량제로 옮겨간 뒤로 기업 재무팀조차 토큰 비용을 미리 가늠하지 못한다는 보도가 이어진다. 청구서가 와야 비용을 아는 회사도 있다.

사람의 한계가 사라진 자리에, 가늠조차 안 되는 기계의 사용이 들어왔다.

구조가 깨지는 지점

여기서 정액제의 전제가 무너진다.

추론은 한계비용이 0이 아니다. 호출 한 번에 실제 GPU 연산이 들고, 그건 공급자에게 진짜 돈이다.
글자 하나 더 받을 때마다 원가가 따라붙는다는 뜻이다.

정액 사용자가 200달러를 내고 종량으로 치면 그 몇 배를 돌리면, 차액은 누군가 메운다. 처음엔 공급자가 성장을 위해 감수한다. 하지만 에이전트로 무한히 돌리는 사람이 늘수록 감당이 안 된다. 본격적으로 개발·테스트하는 사람은 월 1,000달러어치도 우습게 넘긴다.

사용량이 가격과 분리되는 순간, 정액제는 구조적으로 손해를 향해 걷는다. 막는 건 시간문제였다.

두 가지 가격은 두 가지 사용을 판다

정리하면 단순하다.

정액은 “예측 가능한 인간형 사용”을 파는 가격이다. 종량은 “제한 없는 기계형 사용”을 파는 가격이다.

에이전트는 명백히 후자인데, 우리는 전자 가격표를 들고 거기 서 있었다.

그래서 에이전트를 진지하게 돌릴 거면, 토큰 비용은 우회할 변수가 아니라 설계에 넣어야 할 상수다.
정액 우회는 임시방편이었다. 임시방편은 임시였다.

그래서

지금 나는 무거운 자동화는 줄였다.
정말 필요한 호출만 종량으로 연다. 단순한 일은 작은 모델로 내린다.

토큰 청구서가 오기 전에 — 비용을 보는 법

싸게 무한히 쓰는 길은 닫혔다. 이제 무엇에 토큰을 쓸지 고르는 일이 남았다.

정액이 가려주던 질문이다.