인프라가 에이전틱(agentic)으로 전환되고 있다. 지난 50년간 인프라 설계의 전제는 언제나 같았다. 서버를 구성하고, 배포 버튼을 누르고, 로그를 읽는 사람이 반드시 존재한다는 것이었다.
소프트웨어의 세대가 바뀔 때마다, 인프라도 새로운 세대를 요구해왔다.
처음에는 서버를 손으로 직접 구성했다.
다음으로, 클라우드가 인프라를 API로 바꿔놓았다.
그리고 더 중요한 전환이 찾아왔다. 인프라가 애플리케이션 자체로부터 도출되기 시작한 것이다.
이제 LLM과 코딩 에이전트가 다음 전환을 이끌고 있으며, 그 속도는 놀라울 만큼 빠르다.
불과 3개월 만에 Vercel의 주간 배포 수는 두 배로 늘었고, 그 성장을 이끄는 건 에이전트다. 현재 전체 배포의 30% 이상이 코딩 에이전트에 의해 시작되며, 이는 6개월 전 대비 1000% 증가한 수치다. Claude Code가 75%, Lovable과 v0가 6%, Cursor가 1.5%를 차지한다.
에이전트는 AI 네이티브 소프트웨어를 직접 구축하고, 테스트하고, 배포한다. 그것도 기존 운영 방식이 감당하기 어려운 속도로. 코딩 에이전트가 배포한 Vercel 프로젝트는 사람이 배포한 프로젝트보다 AI 추론 프로바이더를 호출할 가능성이 20배 높다. 에이전트는 AI를 활용하는 소프트웨어를 작성하고, 에이전트가 또 다른 에이전트를 만들어낸다.
최종 실행 주체가 사람에서 기계로 넘어가면서, 인프라도 다시 변화해야 할 시점이 됐다. 사용자를 대신해 행동하고, 스스로 코드를 작성하며, 프로덕션에서 자신의 동작을 점점 더 파악해야 하는 소프트웨어를 위한 인프라가 필요하다. 이 새로운 세대의 에이전틱 소프트웨어는 에이전틱 인프라를 요구한다.
이 변화는 하나가 아니라 세 가지 방향으로 전개된다:
코딩 에이전트가 배포할 인프라
에이전트를 구축하고 실행하는 인프라
그 자체가 에이전틱한 인프라
에이전틱 엔지니어링의 병목은 운영상의 마찰이다.
코딩 에이전트가 기능을 작성하면, 그 결과물을 실행하고 테스트하고 검증할 공간이 필요하다. 결국 URL이 필요하다는 뜻이다. 코드에서 실행 중인 시스템으로 가는 과정에 Terraform 상태를 수동으로 관리하거나 클라우드 콘솔 UI를 클릭해야 하는 단계가 끼어 있다면, 자율적인 루프는 깨진다. 에이전트에게는 프로그래밍 방식으로 작동하고 결과가 예측 가능한 배포 환경이 필요하다.
바로 이런 이유로, 불변 배포(immutable deployments), 매 커밋마다 생성되는 프리뷰 URL, 즉각적인 롤백은 단순한 개발자 경험 개선이 아니다. 이는 기계 주도 소프트웨어 개발의 절대적인 전제 조건이다.
Vercel의 CLI, API, MCP 서버, git 연동은 에이전트에게 배포 환경에 대한 네이티브 접근권을 제공한다. 에이전트는 코드를 생성하고, PR을 열고, 프리뷰 URL을 받아 결과물을 검증한 뒤, 사람의 개입 없이 프로덕션까지 배포할 수 있다.
서버리스 워크로드에는 엣지에서의 함수, 캐싱, 단기 요청 처리가 필요하다. 하지만 이 스택을 직접 관리하다 보면 설정 불일치가 생기고, 여러 시스템을 넘나들며 디버깅하는 데 수 시간을 낭비하게 된다. Vercel은 모든 레이어를 프론트엔드 클라우드 하나로 통합해 이 문제를 해결했다.
에이전트 워크로드는 근본적으로 다른 형태를 요구한다. 장시간 실행, 다단계 오케스트레이션, 모델 라우팅, 비용 제어, 샌드박스 코드 실행, 어뷰징 방어가 모두 필요하다. 훨씬 복잡한 스택이며, 직접 운영할 때의 비용은 눈덩이처럼 불어난다. 불필요한 요청 하나하나가 추론 비용을 소모하고, 프로바이더 장애는 에이전트를 오프라인으로 만들며, 신뢰할 수 없는 코드는 프롬프트 인젝션의 문을 열어놓는다.
Vercel의 에이전틱 인프라는 서버리스에서 했던 것과 마찬가지로, 지금까지 구축해온 모든 AI 기본 요소를 하나의 안전한 플랫폼으로 통합한다.
AI SDK는 프레임워크와 프로바이더를 가리지 않고 AI 기반 애플리케이션을 구축할 수 있는 통합 방법을 제공하며, AI SDK 6에서는 에이전트 추상화가 추가되어 에이전트를 한 번 정의하고 다양한 인터페이스와 워크플로에서 재사용할 수 있다.
Chat SDK를 사용하면 단일 코드베이스로 수십 개의 채팅 앱과 플랫폼에 에이전트를 배포할 수 있다.
AI Gateway는 수백 개의 모델에 대한 단일 엔드포인트를 제공하며, 예산 설정, 모니터링, 라우팅, 재시도, 폴백 기능을 갖추고 있다.
Fluid compute는 지연 시간, 동시성, 유휴 대기가 동시에 중요한 AI 워크로드의 특성에 맞게 설계됐다.
Workflows 와 Queues는 에이전트가 작업을 일시 중단하고 재개하며, 재시도하고 상태를 유지하면서 백그라운드 작업을 오프로드할 수 있게 해준다.
Sandbox는 신뢰할 수 없는 코드를 위한 격리된 실행 환경을 제공한다.
Observability는 에이전트의 행동과 오류 발생 지점을 추적할 수 있게 해준다.
이 구성 요소들을 함께 사용하면 에이전트를 구축하고 실행하는 데 필요한 모든 것을 한 곳에서 해결할 수 있다. 더 나아가 Vercel은 이 요소들을 코드, 모델 호출, 런타임 동작이라는 공유 컨텍스트 안에서 하나의 시스템으로 통합한다. 바로 이 컨텍스트가 인프라 자체를 에이전트로 만든다.
기존 인프라는 단방향이었다. 코드가 들어가면 로그가 나오고, 사람이 그 로그를 읽어 코드를 고치는 방식이었다. 통합 플랫폼은 모든 레이어를 실시간으로 완전히 파악할 수 있게 해주며, 에이전트가 프로덕션을 단순히 모니터링하는 수준을 넘어 자율적으로 대응할 수 있는 능력을 갖추게 한다.
핵심 경로에서 지연 시간이 급증하거나 모델 프로바이더가 요청을 거부하기 시작할 때, Vercel은 사람이 알아채기를 기다리지 않는다. 이상 현상을 분석하고, 옵저버빌리티 데이터를 조회하며, 로그를 읽고, 소스 코드를 점검하고, 근본 원인을 파악한 뒤, 격리된 샌드박스에서 수정안을 검토한다. 플랫폼은 개발자가 의도한 것을 파악하고, 시스템이 실제로 한 일을 관찰하며, 그 차이에 따라 행동한다.
현재는 여전히 사람의 승인이 필요한 단계가 남아 있다. 하지만 시간이 지남에 따라 플랫폼이 더 많은 운영 부담을 떠맡게 될 것이다. 개발자를 대체하기 위해서가 아니라, 개발자를 대신해 행동하기에 충분한 컨텍스트를 갖추게 되기 때문이다.
클라우드 컴퓨팅의 역사는 기계에서 사람을 걷어내온 역사다. 에이전틱 인프라는 그 다음 진화로, 명령을 기다리는 수동적인 도구에서 우리를 대신해 능동적으로 행동하는 시스템으로의 전환을 의미한다.
앞으로 10년을 주도할 기업들은 소프트웨어가 스스로 작성되고, 배포되고, 스스로 복구되는 것을 당연한 전제로 설계된 인프라 위에 구축될 것이다.