구글의 새로운 Gemma 4 12B가 26B급 성능을 낸다고 주장함 - 직접 테스트해 봄!
핵심 요약
Gemma 4 12B와 26B-A4B 모델을 로컬에서 테스트한 결과, 12B 모델이 VRAM 효율성 면에서 노트북용으로 매우 적합하다는 평가를 받았습니다.
- 모델 테스트 — RTX 4090 환경에서 HTML5 캔버스 애니메이션 생성 작업 수행
- 성능 비교 — 26B-A4B가 속도와 결과물에서 앞섰으나 12B도 근소한 차이로 선전함
- VRAM 효율성 — 12B 모델은 9GB VRAM만 사용하여 16GB 노트북에 최적화됨
- 모델 구조 — 12B는 밀집형(dense), 26B-A4B는 희소형(sparse) 모델로 각기 다른 특성을 보임
RTX 4090 한 대에서 두 모델을 모두 로컬로 실행했고, 각 모델에 동일한 과제를 주었습니다: 라이브러리 없이 단일 파일로 실제 물리 엔진이 포함된 HTML5 캔버스 애니메이션을 작성할 것. 세 가지 장면 - 갈톤 보드, 벽에 부딪히는 두 개의 블록, 그리고 카오틱한 삼중 진자.
결과:
Gemma 4 26B-A4B: 15 GB VRAM 사용, 6.9k 토큰, 138 tok/s
Gemma 4 12B: 9 GB VRAM 사용, 8.9k 토큰, 80 tok/s
같은 Gemma 4 제품군이지만, 26B-A4B가 모든 장면에서 승리했고 약 1.7배 더 빠르게 실행되었습니다 - 활성 파라미터는 4B뿐인데도 말이죠. 하지만 12B도 VRAM을 거의 절반만 사용하면서 매우 근접한 성능을 보여주었기에, 16GB 노트북에 이상적인 모델입니다.


