Gemma 4 출시
핵심 요약
구글이 256K 컨텍스트와 멀티모달 기능을 갖춘 오픈 웨이트 모델 Gemma 4를 공개함.
- 모델 라인업 — E2B, E4B, 26B, 31B 등 다양한 크기로 출시되어 모바일부터 서버까지 폭넓게 활용 가능함.
- 핵심 기능 — 멀티모달(텍스트, 이미지, 오디오, 비디오) 지원과 256K 컨텍스트 윈도우, 네이티브 추론 모드 탑재.
- 성능 최적화 — 하이브리드 어텐션 메커니즘과 효율적인 아키텍처로 긴 문맥 처리와 빠른 속도를 동시에 확보함.
- 커뮤니티 반응 — Unsloth를 통한 빠른 GGUF 지원과 Qwen 3.5와의 벤치마크 비교에 높은 관심을 보임.
https://huggingface.co/unsloth/gemma-4-26B-A4B-it-GGUF
https://huggingface.co/unsloth/gemma-4-31B-it-GGUF
https://huggingface.co/unsloth/gemma-4-E4B-it-GGUF
https://huggingface.co/unsloth/gemma-4-E2B-it-GGUF
https://huggingface.co/collections/google/gemma-4
What’s new in Gemma 4 https://www.youtube.com/watch?v=jZVBoFOJK-Q
Gemma는 구글 딥마인드가 구축한 오픈 모델 제품군입니다. Gemma 4 모델은 멀티모달로, 텍스트와 이미지 입력을 처리하고(소형 모델은 오디오 지원) 텍스트 출력을 생성합니다. 이번 릴리즈에는 사전 학습된 모델과 지시 조정(instruction-tuned) 모델이 모두 포함되어 있습니다. Gemma 4는 최대 256K 토큰의 컨텍스트 윈도우를 특징으로 하며 140개 이상의 언어에 대한 다국어 지원을 유지합니다.
Dense 및 Mixture-of-Experts(MoE) 아키텍처를 모두 갖춘 Gemma 4는 텍스트 생성, 코딩, 추론과 같은 작업에 적합합니다. 모델은 E2B, E4B, 26B A4B, 31B의 네 가지 크기로 제공됩니다. 다양한 크기 덕분에 고성능 휴대폰부터 노트북, 서버에 이르기까지 다양한 환경에 배포할 수 있어 최첨단 AI에 대한 접근성을 민주화합니다.
Gemma 4는 주요 기능 및 아키텍처 발전을 도입했습니다:
- 추론 – 제품군 내 모든 모델은 구성 가능한 사고 모드를 갖춘 고성능 추론기로 설계되었습니다.
- 확장된 멀티모달 – 텍스트, 가변 종횡비 및 해상도를 지원하는 이미지(모든 모델), 비디오, 오디오(E2B 및 E4B 모델에서 기본 지원)를 처리합니다.
- 다양하고 효율적인 아키텍처 – 확장 가능한 배포를 위해 다양한 크기의 Dense 및 Mixture-of-Experts(MoE) 변형을 제공합니다.

