AI에서 경쟁 우위를 결정하는 건 에이전트 자체가 아니라, 에이전트를 배포하는 플랫폼이다.
프로토타이핑은 누구나 할 수 있게 됐지만, 프로덕션 배포는 여전히 다른 문제입니다.
AI 모델이 코드와 에이전트 생성을 범용화하면서, 이제 누구든 몇 분 만에 정교한 소프트웨어를 만들 수 있게 되었습니다. Claude는 아침 커피가 식기도 전에 완전히 작동하는 에이전트를 뚝딱 만들어 냅니다. 하지만 바로 그 AI가, 월 50만 원이면 충분히 돌아가는 시스템에 월 500만 원짜리 DevOps 구성을 거침없이 설계해 주기도 합니다.
누구나 내부 도구와 에이전트를 만들 수 있는 시대에, 직접 구축(Build)과 구매(Buy)의 손익 구조는 근본적으로 달라졌습니다. 경쟁 우위는 더 이상 '만들 수 있느냐'에서 나오지 않습니다. 비즈니스의 실제 문제를 해결하는 AI를 빠르게 반복 개선하고, 더 중요하게는 그 시스템을 대규모로 안정적으로 운영하는 데서 나옵니다.
이를 위해 기업에는 외부 제품 인프라만큼 견고한 내부 AI 스택이 필요합니다. Vercel의 에이전트 오케스트레이션 플랫폼이 바로 그 역할을 합니다.
수십 년간, 커스텀 내부 도구의 경제성은 대기업에서만 성립했습니다. 초기 엔지니어링 투자도 컸지만, 진짜 비용은 높은 SLA와 측정 가능한 ROI를 유지하며 장기적으로 운영하는 데 있었습니다. 그 외 대부분의 기업에게는 기성 소프트웨어를 구매하는 것이 현실적인 선택이었습니다.
AI가 이 방정식을 근본적으로 바꿔 놓았습니다. 이제 어떤 규모의 기업이든 에이전트를 빠르게 만들 수 있고, 전문화된 워크플로에 맞춘 커스터마이징은 즉각적인 ROI를 제공합니다:
OpenAI는 데이터 분석의 민주화를 위해 내부 데이터 에이전트를 배포했습니다
Vercel의 리드 검증 에이전트는 SDR 1명이 10명분의 업무를 처리할 수 있게 합니다 (템플릿은 여기)
Stripe는 고객 대상 재무 임팩트 계산기를 만들었습니다 (비행기에서!)
이제 질문은 '구축이냐, 구매냐'가 아닙니다. 답은 '구축하고 직접 운영하는 것'입니다. 내부 시스템과 외부 벤더를 분리하는 대신, 에이전트 워크로드의 고유한 요구사항을 모두 처리할 수 있는 단일 플랫폼이 필요합니다.
내부 앱과 에이전트의 활용 사례는 폭발적으로 늘고 있지만, 문제는 따로 있습니다. 프로덕션 운영이 여전히 어렵다는 것입니다.
바이브 코딩(Vibe coding)은 역사상 가장 큰 규모의 섀도 IT 문제를 만들어 내고 있습니다. 프로덕션 운영을 제대로 하려면 보안, 관측성, 안정성, 비용 최적화에 대한 전문 지식이 필요한데, 구축이 쉬워진 지금도 이런 역량은 여전히 희소합니다.
에이전트의 진짜 과제는 만드는 것이 아니라, 그것이 실행되는 플랫폼에 있습니다.
OpenAI처럼, 우리도 d0라는 내부 데이터 에이전트를 직접 만들었습니다 (OSS 템플릿은 여기). d0의 핵심은 text-to-SQL 엔진으로, 개념 자체는 새롭지 않습니다. d0를 성공적인 제품으로 만든 건 그 아래를 받치는 플랫폼이었습니다.
Vercel에 내장된 프리미티브와 배포 인프라를 활용해, 한 명의 엔지니어가 업무 시간의 20%만 투입하여 몇 주 만에 d0를 완성했습니다.
이것이 가능했던 이유는 Sandboxes, Fluid compute, AI Gateway가 운영 복잡성을 자동으로 처리해 주었기 때문입니다. 이런 작업을 직접 구축하고 보안까지 갖추려면 보통 수개월의 엔지니어링이 필요합니다.
현재 d0는 기존에 전문 분석가만 접근할 수 있었던 데이터를 완전히 민주화했습니다. 엔지니어, 마케터, 경영진 모두 자연어로 질문하고, 데이터 웨어하우스에서 즉각적이고 정확한 답변을 받을 수 있습니다.
작동 방식은 다음과 같습니다:
사용자가 Slack에서 질문합니다: "지난 분기 Enterprise ARR이 얼마였나요?" d0가 메시지를 수신하면, 해당 사용자의 권한에 따라 적절한 데이터 접근 수준을 판단하고 에이전트 워크플로를 시작합니다.
에이전트가 시맨틱 레이어를 탐색합니다: 시맨틱 레이어는 데이터 웨어하우스, 메트릭, 제품, 운영 정보를 기술하는 YAML 기반 설정 파일 5계층으로 구성된 파일 시스템입니다.
AI SDK가 모델 호출을 처리합니다: 스트리밍 응답, 도구 사용, 구조화된 출력이 모두 기본 제공됩니다. 별도의 LLM 연동 코드를 작성할 필요 없이, 모든 Vercel 개발자가 사용할 수 있는 동일한 추상화를 그대로 활용했습니다.
에이전트의 각 단계가 내구성 있게 오케스트레이션됩니다: 특정 단계에서 장애가 발생하면(Snowflake 타임아웃, 모델 오류 등), Vercel Workflows가 자동으로 재시도하고 상태를 복구합니다.
자동화된 작업은 격리된 환경에서 실행됩니다: 파일 탐색, SQL 생성, 쿼리 실행 모두 안전한 Vercel Sandbox 안에서 이루어집니다. 비정상적인 작업이 외부로 영향을 주지 못하며, 에이전트는 고급 분석을 위해 임의의 Python 코드도 실행할 수 있습니다.
비용과 정확도의 균형을 위해 여러 모델을 활용합니다: AI Gateway가 단순한 요청은 빠른 모델로, 복잡한 분석은 Claude Opus로 라우팅합니다. 이 모든 것이 하나의 코드베이스에서 이루어집니다.
답변이 Slack으로 전달됩니다: AI SDK Chatbot 프리미티브를 통해, 정리된 결과가 차트나 Google Sheet 링크와 함께 Slack으로 전송됩니다.
Vercel은 내부용과 고객 대면용 에이전트 워크로드에 특화된 인프라 프리미티브를 제공합니다. 에이전트는 여러분이 만들고, Vercel이 운영합니다. 그냥 됩니다.
자체 에이전트 오케스트레이션 플랫폼을 직접 사용하면서, 점점 더 많은 커스텀 에이전트를 구축하고 관리할 수 있게 되었습니다.
내부에서 운영 중인 에이전트:
리드 검증 에이전트
d0, 애널리틱스 에이전트
고객 지원 에이전트 (초기 문의의 87%를 처리)
위험 콘텐츠를 탐지하는 어뷰징 감지 에이전트
Slack 스레드를 블로그 포스트 초안으로 변환하는 콘텐츠 에이전트
제품 측면에서는:
v0는 코드 생성 에이전트이며,
Vercel Agent는 풀 리퀘스트 리뷰, 인시던트 분석, 조치 권고를 수행합니다.
두 제품 모두 내부 도구와 동일한 프리미티브 위에서 실행됩니다.
Sandboxes는 에이전트가 민감한 자율 작업을 실행할 때 안전하고 격리된 환경을 제공합니다. 핵심 시스템을 보호하는 데 필수적입니다. 에이전트가 검증되지 않은 코드를 생성·실행하거나 프롬프트 인젝션 공격을 받더라도, 샌드박스는 격리된 Linux VM 안에서 피해를 차단합니다. 에이전트가 정보 탐색을 위해 파일 시스템에 접근해야 할 경우, 적절한 리소스에 대한 보안 접근 권한이 설정된 VM을 동적으로 마운트할 수 있습니다.
Fluid compute는 에이전트가 만들어 내는 예측 불가능하고 장시간 실행되는 컴퓨팅 패턴을 자동으로 처리합니다. 텍스트를 처리하는 단계에서는 컴퓨팅 자원을 간과하기 쉽지만, 사용량이 늘고 파일·이미지·영상 같은 데이터 집약적 워크로드가 추가되면 비용은 순식간에 문제가 됩니다. Fluid compute는 수요에 따라 자동으로 스케일 업/다운하며, 실제 컴퓨팅 시간만 과금되므로 비용을 낮고 예측 가능하게 유지합니다.
AI Gateway는 수백 개의 모델에 대한 통합 접근과 함께, 예산 관리, 사용량 모니터링, 프로바이더 간 로드 밸런싱을 기본 제공합니다. 벤더 종속을 피하고 최신 모델에 즉시 접근하는 데 핵심적인 기능입니다. 에이전트가 다양한 유형의 쿼리를 처리해야 할 때, AI Gateway는 단순한 요청은 빠르고 저렴한 모델로, 복잡한 분석은 고성능 모델로 라우팅할 수 있습니다. 주요 프로바이더가 속도 제한에 걸리거나 장애가 발생하면, 트래픽이 자동으로 백업 프로바이더로 페일오버됩니다.
Workflows는 에이전트가 복잡한 다단계 작업을 안정적으로 수행할 수 있게 합니다. 에이전트가 핵심 비즈니스 프로세스에 사용될 때 장애 비용은 큽니다. 내구성 있는 오케스트레이션이 매 단계마다 재시도 로직과 오류 처리를 제공하므로, 중단이 발생해도 수동 개입이나 전체 작업 재시작 없이 복구됩니다.
Observability는 기본적인 시스템 메트릭을 넘어, 에이전트가 실제로 무엇을 하고 있는지 보여줍니다. 예기치 않은 동작을 디버깅하고 에이전트 성능을 최적화하는 데 필수적인 데이터입니다. 에이전트가 예상과 다른 결정을 내리거나, 토큰을 과도하게 소비하거나, 성능이 저하될 때, 관측성을 통해 정확한 프롬프트, 모델 응답, 의사결정 경로를 확인하고 문제를 특정 모델 호출이나 데이터 소스까지 추적할 수 있습니다.
머지않아 모든 기업이 자사만의 d0를 만들 것입니다. 내부 코드 리뷰 에이전트도, 고객 지원 라우팅 에이전트도, 그리고 수백 가지 전문화된 도구도 만들 것입니다.
이 에이전트들의 성공은 그것을 실행하는 플랫폼에 달려 있습니다. 지금 내부 AI 스택에 투자하는 기업은 단순히 빠르게 움직이는 데 그치지 않을 것입니다. 시간이 지날수록 복리처럼 쌓이는 우위를 통해 훨씬 높은 ROI를 경험하게 될 것입니다.