많은 사람들이 AI를 대화를 나누는 도구로 사용한다.
질문을 던지고 답을 받고, 다시 질문을 이어가는 방식이다.
하지만 실제 업무에서는 다른 순간이 온다.
AI가 대화 상대가 아니라 워크플로우를 실행하는 엔진처럼 작동하기 시작하는 순간이다.
최근 Claude를 사용하면서 그 차이를 꽤 명확하게 체감했다.
프롬프트 시나리오로 실행한 투자 분석
최근 45+개 기업의 6개년 재무 데이터를 분석해야 하는 상황이 있었다.
보통이라면 데이터 수집, 데이터 검증, 영업이익률 분석, 기업 순위 산정, 투자 코멘트 정리까지 최소 며칠은 걸리는 작업이다. 이번에는 접근 방식을 조금 다르게 가져갔다. 전체 분석 과정을 하나의 프롬프트 시나리오로 설계하고, Claude가 그 흐름을 따라 작업하도록 했다.
분석 구조는 다음과 같았다.
– 재무 데이터 수집 → 데이터 교차 검증 → 영업이익률 / CAGR / YoY 분석 → Top 30 기업 순위 산정.
웹 검색부터 Excel 파일 생성까지 분석이 하나의 세션 안에서 이어졌다.
결과물은 3개의 시트로 구성된 스프레드시트로 특히 Excel 수식(CAGR, YoY, 조건식)이 구조적으로 연결되어 있어서 데이터를 수정하면 분석 결과가 자동으로 갱신되는 형태였다.
이 경험을 통해 느낀 점은 단순했다.
Claude를 쓰면서 체감되는 차이는 대화 능력보다는 워크플로우 실행 능력에 가까웠다.
같은 작업, 다른 결과
같은 작업을 Gemini와 ChatGPT에서도 시도해봤다.
Gemini는 웹 검색 단계까지는 무난했지만 데이터 정제 단계에서 컨텍스트가 끊기는 경우가 있었다.
ChatGPT는 분석 자체는 괜찮았지만 Python 코드로 결과를 생성하는 방식이라 데이터 수정 시 자동 갱신되는 스프레드시트 구조는 아니었다.
반면 Claude는 실제 Excel 수식을 사용해 분석 시트를 구성했다.
겉보기에는 작은 차이처럼 보일 수 있다. 하지만 B2B 환경에서는 중요한 기준이 된다.
고객에게 전달 가능한 산출물인지, 아니면 내부 참고용 분석인지가 달라지기 때문이다.
이 경험을 통해 하나의 기준이 정리됐다.
B2B 환경에서 AI의 경쟁력은 보통 세 가지에서 갈린다.
워크플로우 실행의 일관성, 전달 가능한 산출물의 품질, 도구 통합의 깊이.
단순히 “어떤 모델이 더 똑똑한가”라는 질문만으로는 이 차이를 설명하기 어렵다.
AI를 도구가 아니라 시스템으로 사용하기
좋은 분석은 한 번으로 끝나는 것이 아니라 재현 가능해야 의미가 있다.
그래서 이번 분석 시나리오를 .skill 파일로 패키징했다.
이 파일 안에는 기업 데이터 수집 후 검증 체크리스트, 검색 전략 가이드, 분석 파이프라인이 포함되어 있다.
다음번에는 파라미터만 바꾸면 동일한 분석 구조를 다시 실행할 수 있다.
그리고 Notion에는 개인 지식 축적용 Seeds Log, Agent Registry라는 데이터베이스를 만들어 Skill과 Agent를 관리하고 있다. 각 항목에는 Type(Agent / Skill), Version, Changelog 등의 정보가 기록되고, 필요하면 이전 버전으로 롤백할 수 있도록 구조를 잡았다.
이 구조를 만들면서 하나의 역할 분리가 자연스럽게 생겼다.
Notion = control plane
Claude = data plane
Notion에서 작업 의도와 구조를 정의하고, Claude는 그 구조를 실행한다.
이 방식이 자리 잡으면서 AI 활용 방식도 조금 바뀌었다.
질문을 던지는 도구라기보다 워크플로우를 실행하는 시스템에 가까워졌다.
MCP — 도구 통합이 만드는 차이
Claude의 강점 중 하나는 MCP(Model Context Protocol) 기반의 도구 통합이다.
중요한 것은 플러그인의 개수가 아니라 업무 흐름이 연결된다는 점이다.
예를 들어 다음과 같은 흐름이 자연스럽게 이어질 수 있다.
분석 결과를 Notion DB에 기록하고, Slack으로 팀에 공유하고, Gmail로 보고서를 전송하고, Google Calendar에 후속 미팅을 등록하는 것.
분석 → 기록 → 공유 → 실행
이라는 업무 흐름 전체를 AI가 이어줄 수 있다.
이 구조가 안정적으로 작동하기 시작하면 AI는 단순한 보조 도구가 아니라
워크플로우를 관통하는 실행 레이어에 가까워진다.
AI 공급망 리스크
3월 초, Anthropic 서비스 장애로 Claude를 사용할 수 없는 상황이 있었다.
그날 하루 동안 일부 워크플로우가 멈췄다.
이 경험을 통해 하나의 교훈이 남았다.
많은 조직이 기술 공급망 리스크를 관리하지만, 개인 단위의 AI 워크플로우는 종종 단일 모델에 의존하게 된다. 물론 다른 모델로 바로 대체한다고 동일한 품질이 나오지는 않는다. Skill 시스템이나 도구 통합 구조가 특정 모델 위에 쌓여 있기 때문이다.
그래도 핵심 워크플로우에 대한 fallback 경로는 미리 생각해둘 필요가 있다.
좋은 도구에 깊이 의존하되, 그 의존 자체가 리스크가 되지 않도록 구조를 설계하는 것 역시 시스템 사고의 일부다.
B2B AI는 “대화”보다 워크플로우에 가깝다
최근 Claude Code의 Agent Teams 기능을 활용해 AI 마케팅 팀을 운영한 스타트업 사례를 본 적이 있다.
CMO, 콘텐츠 작성자, 소셜 담당, 성과 분석가 역할을 자연어로 정의하고
콘텐츠 생산부터 성과 분석까지의 사이클을 운영하는 방식이었다.
흥미로운 점은 기술 자체보다 시스템 설계 방식이었다.
코딩을 하지 않아도 자연어만으로 업무 구조를 정의하고 실행할 수 있다는 점이다.
돌이켜보면 많은 AI 활용 사례가 같은 방향을 가리킨다.
AI의 경쟁력은 단순한 모델 성능이 아니라
워크플로우를 얼마나 안정적으로 실행할 수 있는가에 가까워지고 있다.
AI 파워유저의 무기고
아이디어는 Notion Seeds DB에 기록하고 분석은 Skill로 패키징하고, 정리된 생각은 글로 확장된다.
이 흐름이 자리 잡고 나니 AI는 가끔 사용하는 도구라기보다
생각과 작업을 연결하는 시스템의 일부가 되었다.
정원사에게도 무기고가 필요하다.
좋은 삽, 물뿌리개,
그리고 언제 수확할 때가 되었는지 알아보는 감각.
내 AI 무기고에는 Claude가 있다.

댓글 남기기