r/LocalLLaMA•약 2개월 전•693•256
Qwen 3.6 성능 향상은 진짜다, 설정만 제대로 하면 됨
핵심 요약
Qwen 3.6 모델이 Opus나 Codex에 근접하는 뛰어난 성능과 놀라운 속도를 보여줌.
- 성능 향상 — Opus나 Codex 수준에 근접하는 실용적인 성능을 보여줌
- 속도 최적화 — M5 Max 환경에서 8bit 3K PP, 100 TG 설정으로 매우 빠른 속도 구현
- 필수 설정 — `preserve_thinking` 옵션을 활성화해야 최상의 결과 확인 가능
보통 Opus나 Codex만 믿고 맡기던 작업들을 돌려보고 있는데, 3.6이 정말 유능하다는 걸 확인했어. 물론 그 모델들 수준은 아니지만, 확실히 실용성의 경계를 넘었어. 게다가 M5 Max 128GB 8bit 3K PP, 100 TG 환경에서 oMLX + Pi.dev로 돌리니까 속도가 엄청나.
preserve_thinking이 켜져 있는지 꼭 확인해. 자세한 내용은 여기서 확인해 봐.

