Alibaba Qwen 팀이 최근 몇 주에 걸쳐 공개한 오픈 웨이트(open weight) 모델 패밀리 Qwen 3.5는 정말 주목할 만한 성과다. 아직 이를 제대로 다루지 못한 것이 아쉽지만, 더 걱정되는 건 따로 있다. 지난 24시간 사이 팀의 핵심 인재들이 잇달아 자리를 떠났다는 소식이 전해지면서, Qwen 3.5가 이 팀의 마지막 역작으로 남는 것 아닌가 하는 우려가 커지고 있다.
이 모든 일의 시작은 Junyang Lin(@JustinLin610)이 올린 이 트윗이었다.
저 물러납니다. 안녕, 내가 사랑한 Qwen.
Junyang Lin은 Qwen 개발을 이끈 수석 연구원으로, 2024년 이후 오픈 웨이트 모델 공개에 핵심적인 역할을 해온 인물이다.
아직 확인된 사실은 아니지만, 이번 사임의 직접적인 계기는 Alibaba 내부 조직 개편인 것으로 보인다. Google Gemini 팀 출신의 신규 연구원이 Qwen을 맡게 되면서 갈등이 빚어졌다는 이야기가 나오고 있다.
더 자세한 내용은 36kr.com의 이 기사에서 확인할 수 있다. 위키피디아의 36Kr 항목에 따르면, 36Kr은 2010년에 설립된 신뢰할 수 있는 미디어로, 중국 테크 산업을 꾸준히 취재해온 매체다.
해당 기사는 중국어로 작성되어 있다. Google 번역을 통해 주요 내용을 옮기면 다음과 같다.
3월 4일 베이징 시간 오후 1시경, 통이(Tongyi) 랩은 긴급 전체 회의를 소집했다. 이 자리에서 Alibaba 그룹 CEO 우융밍(Wu Yongming)은 Qianwen(千問) 직원들에게 솔직하게 상황을 전했다.
12시간 전인 3월 4일 오전 0시 11분(베이징 시간), Alibaba 대형 언어 모델 Qwen의 기술 총괄 린준양(Lin Junyang)이 X에 갑작스러운 사임 의사를 밝혔다. 린준양은 Alibaba 오픈소스 AI 모델 발전을 이끌어온 핵심 인물이자, Alibaba 최연소 P10 직급자 중 한 명이었다. 업계가 술렁이는 가운데, Qwen 팀 내부에서도 핵심 인물의 갑작스러운 이탈을 받아들이지 못하는 이들이 적지 않았다.
"경쟁사보다 훨씬 적은 리소스로 지금의 성과를 만들어낸 데는 준양의 리더십이 결정적이었다"고 복수의 Qianwen 팀원들이 36Kr에 전했다. [...]
린준양의 향후 행보에 대해서는 이날 회의에서 결론이 나지 않았다. 다만 오후 2시경, 그는 웨이신(WeChat) 모멘트에 "Qwen의 형제들, 원래 계획대로 계속 나아가면 돼, 문제없어"라는 글을 남겼다. 복귀 여부는 명확히 밝히지 않은 채로. [...]
기사에는 린준양 외에 사임 의사를 밝힌 것으로 알려진 핵심 인물들도 함께 언급되어 있다.
린준양의 이탈과 함께 다수의 Qwen 팀원들도 퇴사를 선언했다. 각 세부 분야를 책임지던 핵심 리더들로, 구체적으로는 다음과 같다.
Binyuan Hui: Qwen 코드 개발 총괄. Qwen-Coder 시리즈 모델의 핵심 기여자로, 사전 학습부터 사후 학습에 이르는 전체 에이전트 학습 파이프라인을 담당했으며, 최근에는 로보틱스 연구에도 참여했다.
Bowen Yu: Qwen 사후 학습 연구 총괄. 중국과학원대학교 출신으로, Qwen-Instruct 시리즈 모델 개발을 이끌었다.
Kaixin Li: Qwen 3.5/VL/Coder의 핵심 기여자. 싱가포르 국립대학교 박사 출신이다.
이들 외에도 다수의 젊은 연구원들이 같은 날 사임한 것으로 전해진다.
현재로서는 상황이 여전히 유동적이다. Alibaba CEO가 직접 긴급 전체 회의에 나섰다는 사실은, 회사 측이 이번 이탈 사태의 무게를 충분히 인식하고 있으며 일부 인재를 붙잡기 위한 노력을 기울일 가능성이 있음을 시사한다.
Qwen 3.5 모델이 탁월한 성능을 보여주고 있는 시점에 터진 이번 소식이라 더욱 뼈아프게 느껴진다.
아직 충분히 사용해보지는 못했지만, 이번 모델 패밀리의 규모 자체가 이미 인상적이다. 2월 17일 공개된 807GB 규모의 Qwen3.5-397B-A17B를 시작으로, 122B, 35B, 27B, 9B, 4B, 2B, 0.8B에 이르는 다양한 크기의 모델들이 연달아 출시되었다.
27B와 35B 모델은 32GB/64GB Mac에서도 구동 가능해 코딩 작업에 좋다는 평이 들려오고 있으며, 직접 사용해본 9B, 4B, 2B 모델도 크기 대비 성능이 놀라울 정도였다. 2B 모델은 용량이 고작 4.57GB, 양자화(quantized) 시 1.27GB까지 줄어드는데, 추론과 멀티모달(비전) 기능을 모두 갖춘 풀 모델이다.
더 작은 모델에서 더 높은 품질을 끌어내는 방법을 꾸준히 찾아온 Qwen 팀이 지금 이 시점에 해체된다면, 그것은 정말 안타까운 일이 될 것이다.
핵심 팀원들이 새로운 도전에 나서든, 다른 연구소에 합류하든, 그들이 다음에 어떤 성과를 내놓을지 기대가 크다.
지금은 블로그의 장문 아티클만 표시되고 있습니다. 모든 포스트를 받아보려면 /atom/everything/을 구독하거나, 다른 구독 옵션을 확인해보세요.