Gamma가 AI SDK, Vercel Functions, Edge Network를 활용해 디자인 중심의 AI 에이전트를 대규모로 구축하는 과정을 소개합니다.
Gamma는 단순한 아이디어에서 시작했습니다. 프레젠테이션이 스스로 디자인한다면 어떨까?
문장 하나만 입력하면 레이아웃, 간격, 위계를 모두 갖춘 완성된 프레젠테이션이 만들어집니다. 컬럼은 자동으로 재배치되고, 새 레이어를 추가하면 다이어그램도 알아서 조정됩니다. 서식은 제품이 처리하니, 팀은 오직 아이디어에만 집중할 수 있습니다.
이런 철학은 회사의 DNA에 깊이 뿌리내리고 있습니다. Gamma의 초기 10명 중 서너 명이 디자이너였습니다. AI·프로덕트 엔지니어링을 이끄는 Sherwin Yu는 이렇게 말합니다. "디테일에 대한 집착과 디자인의 가치는 정말 초창기부터 문화에 녹아 있었습니다. Gamma의 디자이너들은 정말 뛰어나요. 코드를 직접 작성하고, 기술적 역량도 갖추고 있죠. 프로덕션에 직접 배포까지 합니다."
Gamma에는 제품 속 감탄스러운 인터랙션을 공유하는 Slack 채널이 있고, 사소하지만 거슬리는 문제점을 모아두는 '페이퍼컷(paper cuts)' 채널도 따로 운영합니다.
Sherwin은 말합니다. "가능한 모든 순간에 사용자 경험을 한 단계 끌어올리려면 어떻게 해야 할지, 끊임없이 논의합니다."
사용자가 늘어나면서 팀은 깨달았습니다. 생성은 시작에 불과했습니다. 프레젠테이션의 진짜 작업은 반복적인 수정 과정에서 이루어집니다. 개요를 잡고, 구조를 바꾸고, 톤을 다듬고, 비주얼을 정리하죠. 2025년 10월, Gamma는 대화형 편집 기능인 Gamma Agent를 출시하며 AI의 역할을 일회성 생성에서 협업 기반의 에이전틱 워크플로로 전환했습니다. 이 변화에는 더 나은 프롬프트가 아니라, 오케스트레이션이 필요했습니다.
Gamma의 첫 번째 버전은 프롬프트 하나로 덱을 생성하는 방식이었습니다. Gamma Agent는 여기에 대화를 도입했고, 이를 통해 사용자와 제품의 관계가 근본적으로 달라졌습니다. 초기에는 대화가 일회성이어도 무방했습니다. 사용자가 Gamma Agent를 열고, 몇 가지 수정을 한 뒤, 그대로 떠나는 패턴이었죠. 채팅 상태를 브라우저 로컬 스토리지에 저장하는 것만으로도 충분했습니다.
하지만 더 강력한 에이전트를 프로토타이핑하면서 이 단순한 구조는 한계에 부딪혔습니다. 대화 상태를 더 세밀하게 제어해야 했습니다. 에이전트 간에 컨텍스트를 연결하고, 세션을 넘나들며 메시지 이력을 관리하고, 단순한 요청-응답 루프를 넘어서는 복잡한 다단계 인터랙션을 오케스트레이션할 수 있어야 했습니다. 워크플로 초반에 사용자가 내린 결정, 구조를 선택한 이유, 최종 확정한 톤… 이 모든 것이 일회용 채팅 창에 묻히기엔 너무 귀중한 컨텍스트였습니다.
Sherwin은 이렇게 설명합니다. "AI SDK의 useChat 훅은 단순한 대화에는 훌륭하지만, 메시지 상태를 자체적으로 관리하기 때문에 그 위에 자체 컨텍스트 관리 로직이나 기능을 덧붙이기가 어려웠습니다. 저희 엔지니어 한 명이 SDK 내부를 파고들다가 더 저수준의 API를 발견했는데, 이를 통해 대화 상태를 직접 제어하면서도 스트리밍과 도구 호출 인프라는 그대로 활용할 수 있었습니다."
자체 오케스트레이션 코드 대신 AI SDK 위에 구축한 덕분에, Gamma는 백엔드를 다시 설계하지 않고도 에이전트의 동작을 유연하게 발전시킬 수 있습니다.
조합 가능하고 모델에 구애받지 않는 아키텍처에 대한 Gamma의 투자는 텍스트 영역을 넘어섭니다. 20개 공급자의 60개 모델을 통해 15억 장 이상의 이미지를 생성해 온 이미지 파이프라인 역시 자체적인 아키텍처 전환을 거쳤습니다.
이미지 생성의 최전선에 서 있으려면 새 모델을 빠르게 통합해야 합니다. 출시 후 며칠 안에 적용해야 할 때도 있습니다. Vercel AI SDK가 조합 가능한 미들웨어 레이어를 갖춘 이미지 생성 표준 인터페이스 ImageModelV3를 도입했을 때, Gamma 팀은 LLM 쪽에서 발견한 것과 같은 기회를 포착했습니다. 인프라와 제품을 분리하고, 모델을 선언적으로 정의하며, 기능이 자유롭게 조합되도록 하는 것이었습니다.
현재 Gamma에 새 이미지 모델을 추가하는 데 필요한 것은 약 30줄의 설정뿐입니다. ID, 비용 산정 공식, 지원 사이즈, 기능 플래그만 지정하면 됩니다. 트레이싱, 비용 추적, 이미지 전처리는 모든 모델을 감싸는 공유 미들웨어가 자동으로 처리합니다. 엔지니어는 이런 배관 작업을 신경 쓸 필요 없이, 모델이 무엇을 할 수 있는지만 선언하면 됩니다. 이 구조는 제품에서 바로 효과를 발휘합니다.
AI 인포그래픽 기능을 출시할 때, Gemini는 멀티모달 스타일 레퍼런스(목표 미적 감각을 보여주는 실제 이미지)가 필요한 반면 Flux는 간결한 텍스트 전용 프롬프트에서 최상의 결과를 냈습니다. 모델 레이어가 설정만으로 구성되기 때문에, 이런 모델별 전략은 인프라 깊숙한 곳이 아니라 기능 코드 안에 존재합니다. 새 모델, 새 기능, 새 역량—각각이 독립적입니다.
결과적으로 Gamma는 새 모델을 몇 주가 아닌 며칠 만에 출시하며, 모든 모델은 첫 번째 요청부터 프로덕션 수준의 관측성(observability)을 자동으로 갖추게 됩니다.
Gamma는 배포 워크플로에도 같은 철학을 적용합니다. 안정적인 기반을 선택하고, 그 위에서 빠르게 움직이는 것입니다. 자체 릴리스 시스템을 구축하는 대신, Vercel의 Preview Deployments, 프로덕션 배포, Instant Rollbacks를 활용합니다.
Sherwin은 말합니다. "굳이 직접 만들 필요 없는 인프라를 다시 발명하지 않으려고 합니다. 그 엔지니어링 에너지를 제품에 쏟는 편이 낫죠."
Gamma는 약 20명의 엔지니어로 구성되어 있지만, 프리뷰와 프로덕션을 합쳐 하루 평균 250회 이상의 배포를 수행합니다. 배포 소요 시간의 중앙값은 약 7분이며, 일상적인 CI 취소 건을 제외하면 성공률은 99%에 달합니다.
Preview Deployments 덕분에 모든 풀 리퀘스트에서 에이전트 동작을 안전하게 실험할 수 있고, Instant Rollbacks는 모델 로직이나 오케스트레이션에 영향을 주는 변경 사항을 배포할 때 든든한 안전장치가 됩니다.
Gamma의 AI는 원시 HTML을 출력하지만, 프레젠테이션 카드는 단순한 마크업 그 이상입니다. 레이아웃 규칙, 해상도가 적용된 이미지, 라이브 차트, 편집 가능한 다이어그램이 포함된 구조화된 문서이죠. 생성된 모든 카드는 이 간극을 실시간으로 메우는 변환 레이어를 거칩니다.
Gamma는 이 핵심 변환 레이어를 Vercel Functions로 운영합니다. AI가 생성한 모든 카드는 서버리스 엔드포인트를 거치며, 이 엔드포인트는 JSDOM 안에서 전체 Tiptap 에디터 스키마를 인스턴스화하고, LLM의 HTML 출력을 구조화된 에디터 콘텐츠로 파싱하며, 비동기 에셋을 리졸브합니다. 이 모든 작업이 60초 실행 윈도우 내에서 이루어집니다. 다른 서버리스 함수는 반대 방향—에디터 콘텐츠를 AI가 읽을 수 있는 HTML로 직렬화하는 작업—과 테마 프리뷰 이미지의 온더플라이 생성을 담당합니다.
이 모든 서버리스 함수 구성 덕분에 프레젠테이션은 빠르게 로드되고, AI 기반 편집은 전 세계 사용자에게 즉각적인 반응성을 유지합니다.
업계 전반에서 에이전트의 역량이 높아질수록, 병목은 지능이 아니라 정보로 옮겨갑니다.
Sherwin은 말합니다. "브랜드 가이드라인, 이전 프레젠테이션, 회사의 톤 앤 매너를 아는 에이전트는 범용 모델과는 차원이 다른 가치를 제공합니다. 지금 시점에서 유용한 에이전트와 평범한 챗봇을 가르는 것은 바로 컨텍스트입니다."
그는 컨텍스트가 세 가지 레벨에서 작동한다고 봅니다. 현재 세션, 프로젝트를 아우르는 사용자 이력, 그리고 조직 레이어—브랜드 에셋, 템플릿, 지식 베이스 같은 것들입니다. 이 세 가지를 효율적으로, 적절한 시점에 모델의 컨텍스트 윈도우에 넣는 것이야말로 에이전트를 만드는 모든 기업이 씨름하고 있는 아키텍처 과제입니다.
이는 Gamma가 처음부터 지향해 온 비전과 정확히 맞닿아 있습니다. 아이디어를 세련되고 설득력 있는 커뮤니케이션으로 손쉽게 전환하는 것. 처음에는 지능형 레이아웃과 디자인으로, 이어서 대화형 편집으로, 그리고 이제는 무엇을, 왜 만들고 있는지 이해하는 컨텍스트 레이어를 통해 실현하고 있습니다.
단계마다 기반 모델과 인프라는 달라져 왔습니다. 변하지 않은 것은 Gamma의 구축 방식입니다. 올바른 추상화를 선택하고, 특정 모델에 종속되지 않으며, 지형이 바뀔 때 재구축할 수 있는 유연성을 확보하고, 기회의 창이 닫히기 전에 출시하는 것입니다.
6개월마다 판이 뒤집히는 이 분야에서, 이 적응력이야말로 진정한 경쟁 우위입니다.