DeepSeek이 있어서 다행이야
핵심 요약
DeepSeek이 매달 혁신적인 연구와 오픈 웨이트 모델을 공개하며 AI 기술 발전을 주도하고 있다는 점을 긍정적으로 평가함.
- 오픈 웨이트 모델 — DeepSeek은 매달 연구 논문과 함께 베이스 모델을 즉시 공개하며 기술 발전을 견인함.
- 기업의 폐쇄성 — OpenAI나 Anthropic 등 주요 기업들이 모델 공개를 줄이고 연구 논문 대신 블로그 포스트로 대체하는 추세임.
- 기술적 기여 — 모델 자체뿐만 아니라 커널과 저장소까지 오픈 소스로 공개하여 개발자들에게 실질적인 도움을 줌.
- 하드웨어 제약 — 커뮤니티가 대형 모델을 직접 구축하는 데는 여전히 하드웨어적인 한계가 존재함.
다른 기업들은 서서히 오픈 웨이트에서 멀어지고 있음. 베이스 모델을 공개하지 않거나, 오픈 웨이트 배포를 늦추거나, 최상위 모델을 내놓지 않음(이건 이해가 가지만 그래도 아쉬움). 그리고 연구 결과 발표도 멈춘 것 같음(예전 Gemma나 Qwen은 모델 학습과 특성에 대한 상세한 논문이 있었는데, 지금은 블로그 포스트나 모델 카드로 대체됨).
Kimi(Kimi k2.5 베이스 모델 없음), GLM(glm 5 및 5.1 베이스 모델 없음), minimax(오픈 웨이트 지연 및 m2.7의 문제 있는 라이선스), 그리고 Qwen(Qwen 3.5 397B는 오픈 웨이트였는데 3.6은 아님)이 그런 사례임.
반면 DeepSeek은 매달 놀라운 연구 결과를 발표하고, 베이스 모델을 공개하며, 모델이 공식 출시되자마자 오픈 웨이트를 배포하고, 출시 논문을 통해 모델 학습과 아키텍처를 상세히 설명함.
그들은 이 분야에서 매우 중요하며 기술과 효율성을 앞으로 밀고 나가는 주역들임.
아쉽게도 작은 모델은 출시하지 않지만, 모든 걸 다 가질 수는 없지 않겠음?

