구글 I/O에서 구글이 Gemini 3.5 Flash를 공개했다. 이번 모델은 -preview 딱지 없이 곧바로 정식 출시(GA)로 선보였으며, 구글 주요 제품 전반에 걸쳐 폭넓게 적용될 것으로 보인다:
3.5 Flash는 오늘부터 전 세계 수십억 명이 이용할 수 있다:
- Gemini 앱과 구글 검색의 AI 모드를 통해 일반 사용자에게 제공
- 개발자에게는 에이전트 중심 개발 플랫폼인 Google Antigravity, Google AI Studio의 Gemini API, Android Studio를 통해 제공
- 기업 고객에게는 Gemini Enterprise Agent Platform 및 Gemini Enterprise를 통해 제공
Gemini 릴리스가 으레 그렇듯, 가장 흥미로운 내용은 Gemini 3.5 Flash 업데이트 내역 개발자 문서 깊숙이 담겨 있다. 기능 구성은 이전 Gemini 3.x 시리즈와 대체로 동일하나, computer use는 지원하지 않는다. 모델 ID는 gemini-3.5-flash이며, 학습 데이터 기준일은 2025년 1월, 입력 토큰은 최대 1,048,576개, 출력 토큰은 최대 65,536개를 지원한다.
구글은 현재 베타로 제공 중인 새로운 Interactions API도 함께 선보였다. OpenAI Responses가 도입한 패턴, 특히 서버 측 대화 이력 관리 방식을 구글 방식으로 구현한 것으로 보인다.
Gemini 3.5 Flash와 함께 가격도 눈에 띄게 상승했다. 기존 Flash 계열 모델은 Gemini 3 Flash Preview와 Gemini 3.1 Flash-Lite였다. 새로운 3.5 Flash는 3 Flash Preview 대비 3배, 3.1 Flash-Lite 대비 6배 비싸다(가격 비교 참고).
입력 100만 토큰당 $1.50, 출력 100만 토큰당 $9로, 각각 $2와 $12인 Gemini 3.1 Pro에 근접한 가격대다.
Gemini 팀은 3.5 Pro를 "다음 달" 출시하겠다고 예고했는데, 가격은 더 높아질 것으로 보인다.
이는 업계 전반의 흐름과도 맞닿아 있다. OpenAI의 GPT-5.5는 GPT-5.4 대비 2배 가격이고, Claude Opus 4.7도 새 토크나이저를 감안하면 4.6 대비 약 1.46배 비싸다.
가격 인상에도 불구하고 구글이 자사의 무료 소비자 제품 상당수에 이 모델을 적용한다는 점이 흥미롭다. 주요 AI 기업 세 곳 모두 API 고객의 가격 수용 한계를 슬슬 가늠하기 시작한 것 같다.
Artificial Analysis는 자체 벤치마크를 각 모델에 돌리는 데 드는 비용을 공개하고 있는데, 토크나이저 방식이나 추론 토큰 증가분 같은 변수를 반영할 수 있어 유용한 비교 기준이 된다. 참고할 만한 수치는 다음과 같다:
3.5 Flash (high) 벤치마크 실행 비용이 3.1 Pro Preview를 훌쩍 넘어섰다!
타 벤더 수치도 살펴보면:
"자전거를 타는 펠리컨 SVG를 생성해줘"라고 Gemini API에 요청해 받은 펠리컨인데, 그 결과물이 심상치 않다:

코드 주석 중 일부: <!-- Pelican Eye / Sunglasses (Cool Retro Aviators) -->
저 펠리컨, 크립토 컨퍼런스 참석하러 마이애미에 온 것 같은 비주얼이네요.
이번 요청에 사용된 토큰은 입력 11개, 출력 14,403개로, 총 비용은 13센트에 못 미쳤다.
현재 블로그의 장문 아티클만 표시되고 있습니다. 모든 포스트를 받아보려면 /atom/everything/을 구독하거나, 다른 구독 옵션을 확인해보세요.