정액 요금제로 에이전트를 돌릴 수 없는 이유

한동안 나는 월 정액 구독 하나로 openclaw 기반 AI 에이전트를 24시간 돌렸다. 홈서버에 올려두고, 자는 동안에도 일을 시켰다.

싸고 좋았다. 오래 못 갈 거라는 것만 빼면.

얼마 전 그 길이 막혔다. Anthropic이 정액 구독으로 외부 도구를 돌리는 걸 차단했다.
구독 인증은 이제 Claude.ai나 Claude Code 같은 공식 도구에서만 허용된다.
OpenClaw 같은 에이전트 프레임워크가 첫 대상이었다.

“또 플랫폼이 빗장을 걸었다”고 보면 그냥 뉴스다. 한 번 지나가면 끝이다.
그런데 내가 궁금했던 건 다른 거였다. 이게 왜 처음부터 지속될 수 없는 구조였나.

정액제가 사는 것

정액제 가격은 한 가지 전제 위에 매겨진다. 사람이 사람처럼 쓴다는 것.

월 2만 원, 20만 원 같은 가격은 “하루에 몇 번 대화한다”를 기준으로 짜였다.
많이 쓰는 사람은 적게 쓰는 사람이 떠받는다. 헬스장 무제한 회원권과 같다.
매일 가는 소수를, 등록만 하고 안 가는 다수가 보조한다.

이게 성립하려면 조건이 하나 필요하다. 많이 쓰는 사람도 결국 사람의 한계 안에서 쓴다는 것.

에이전트가 깨는 것

에이전트는 그 전제를 깬다.

직접 보면 분명하다.

에이전트가 작업 하나를 처리하는 데 모델 호출이 3~8번 일어난다.
생각하고, 도구를 고르고, 실행하고, 결과를 보고, 다시 고른다. 그때마다 그동안의 대화가 통째로 다시 들어간다.

거기에 정해진 시간마다 스스로 깨어나 상황을 보는 기능까지 붙이면, 내가 한 글자도 안 쳐도 토큰이 나간다.
30분에 한 번이면 하루 48번, 한 달이면 1,400번이 넘는다.

내 경우 어떤 달은 종량으로 환산하니 월 500달러 수준이었다. 정액은 200달러였다.

게다가 얼마를 쓸지 미리 알 수도 없다. LLM은 같은 걸 시켜도 매번 답이 조금씩 다르다. 결정론적이지 않다는 뜻이다. 답이 달라지면 거치는 단계도, 먹는 토큰도 달라진다. 같은 일을 어떤 날은 두 번에 끝내고, 어떤 날은 다섯 번을 돌다. 결국 월말이 돼서야 얼마 나왔는지 안다.

나만 그런 게 아니다. 종량제로 옮겨간 뒤로 기업 재무팀조차 토큰 비용을 미리 가늠하지 못한다는 보도가 이어진다. 청구서가 와야 비용을 아는 회사도 있다.

사람의 한계가 사라진 자리에, 가늠조차 안 되는 기계의 사용이 들어왔다.

구조가 깨지는 지점

여기서 정액제의 전제가 무너진다.

추론은 한계비용이 0이 아니다. 호출 한 번에 실제 GPU 연산이 들고, 그건 공급자에게 진짜 돈이다.
글자 하나 더 받을 때마다 원가가 따라붙는다는 뜻이다.

정액 사용자가 200달러를 내고 종량으로 치면 그 몇 배를 돌리면, 차액은 누군가 메운다. 처음엔 공급자가 성장을 위해 감수한다. 하지만 에이전트로 무한히 돌리는 사람이 늘수록 감당이 안 된다. 본격적으로 개발·테스트하는 사람은 월 1,000달러어치도 우습게 넘긴다.

사용량이 가격과 분리되는 순간, 정액제는 구조적으로 손해를 향해 걷는다. 막는 건 시간문제였다.

두 가지 가격은 두 가지 사용을 판다

정리하면 단순하다.

정액은 “예측 가능한 인간형 사용”을 파는 가격이다. 종량은 “제한 없는 기계형 사용”을 파는 가격이다.

에이전트는 명백히 후자인데, 우리는 전자 가격표를 들고 거기 서 있었다.

그래서 에이전트를 진지하게 돌릴 거면, 토큰 비용은 우회할 변수가 아니라 설계에 넣어야 할 상수다.
정액 우회는 임시방편이었다. 임시방편은 임시였다.

그래서

지금 나는 무거운 자동화는 줄였다.
정말 필요한 호출만 종량으로 연다. 단순한 일은 작은 모델로 내린다.

싸게 무한히 쓰는 길은 닫혔다. 이제 무엇에 토큰을 쓸지 고르는 일이 남았다.

정액이 가려주던 질문이다.

댓글 남기기