r/LocalLLaMA•약 1개월 전•706•100

Qwen 3.6이나 Gemma 4를 로컬에서 돌린다는 것의 의미

핵심 요약

로컬 환경에서 고성능 LLM을 구동해 전문가 수준의 업무를 처리하는 사용자들의 경험과 하드웨어 최적화 논의.

로컬 LLM 성능 — Qwen 3.6과 Gemma 4를 활용해 전문가 수준의 업무를 로컬에서 효율적으로 처리함.
하드웨어 최적화 — RTX 3090 환경에서 MTP와 vLLM 등을 활용해 추론 속도를 극대화하는 기술적 노하우 공유.
에이전트 활용 — 로컬 모델을 에이전트 오케스트레이터와 결합해 자동화된 업무 처리가 가능해짐.
모델 비교 — 특정 작업에 특화된 소형 모델이 범용 모델보다 비용 효율적이고 뛰어난 성능을 보임.

거의 그렇다고 볼 수 있죠, 아주 훌륭한 일꾼들입니다. 저는 이 모델들을 실제 업무 시나리오에서 돌리면서, 예전에 전문가로서 시간당 200달러를 받으며 직접 하던 일들을 처리하고 있습니다. 물론 핵심은 모델의 약점을 보완하는 시스템을 구축하는 것이고, 저는 이미 첫 모델들이 나왔을 때부터 전문가 수준의 업무를 수행하는 LLM 시스템을 사용해 왔습니다(nous hermes 2 mistral에게 경의를!).

정말 깔끔합니다. 특히 3090 클럽이라면 3.6 27B 모델을 단일 3090에서 날아다니게 할 수 있죠.

주요 댓글

r/localllama

로컬 LLM의 비약적인 성능 향상과 실무 활용 가능성에 대해 열광하면서도, 인퍼런스 비용과 직업적 미래에 대한 현실적인 고민이 공존하는 분위기임.

113

Gemma4는 번역이랑 창작 글쓰기에 진짜 좋음. Qwen3.6은 게임도 기가 막히게 잘 만듦. 작은 모델이 어떻게 이렇게 게임을 잘 만드는지 블랙매직 수준임. 90년대 게임 발전 속도 보는 거 같아서 소름 돋네.

잘 모르는 언어 번역할 땐 Gemma4 조심해. 특히 작은 언어들. 라트비아어로 테스트해봤는데 2010년 구글 번역 수준임. 오타 쩔고 관용구 직역 오짐. 프롬프트로 교정 시켜도 절반 정도밖에 못 고침.

흥미롭네. 난 PC98 매뉴얼 번역이랑 오버레이 만드는 데 Gemma4 쓰는 중. 일본어는 꽤 괜찮음. 가끔 틀리긴 해도 전반적으로 훌륭함. 26b q4 모델로 번역이랑 박스 그리기까지 시키는데 박스 위치는 좀 아쉬워도 번역은 대만족임.

대박! 텍스트 바운딩 박스 어떻게 따는 거임? 프롬프트만으로 좌표를 반환한다고? 로컬에서 이런 게 된다니 진짜 미쳤네.

그냥 프롬프트만 넣으면 됨! 자동화 쌉가능. PDF 페이지별로 PNG 추출 -> Gemma4에 이미지 전송 -> XML 저장 -> HTML로 PDF 재구성. 내 프론트엔드 GUI가 구려서 박스 표시가 좀 이상하긴 한데 모델 성능은 확실함.

Qwen 3.6 에이전트 밤새 돌려놨는데 아침까지 멀쩡함. 헛짓거리 안 하고 루프도 안 돎. 꿈만 같음.

뭘 돌린 거임? 단순 스크립트 말고 복잡한 것도 됨?

어떤 퀀트랑 컨텍스트 씀? 35b a3b임 아니면 27b? KV 캐시 퀀타이제이션은?

27b q5_k_m 씀. 120k 컨텍스트는 개느림. 64k가 그나마 나음.

Granite나 Nemotron 같은 특화된 초소형 모델 써보셈. 비용도 안 들고 성능은 프론티어 모델 씹어먹음. 에이전트 오케스트레이터로 관리하면 개꿀임.

모델 이름이랑 용도 좀 공유 가능?

어떤 업무에 쓰는데? 난 소프트웨어 로직이나 회계 같은 전문 지식 문제 해결에 씀.

님 스스로 200달러짜리 일자리를 없애버린 거 아님? 누가 더 싸게 LLM으로 똑같은 일 할 텐데. 나중엔 클라우드 기업들이 무료로 풀어버릴걸.

글쎄, 요즘 인퍼런스 비용 때문에 다들 난리임. VC 돈 다 떨어지고 보조금 끊기면 오픈 모델이 다 잡아먹을 듯.

3090 쓰는데 60tps 절대 안 나오던데. dflash 써도 35가 한계임.

지금 같이 볼 만한 글

r/ChatGPT

평균적인 레딧 관리자 모습 그려줘

AI가 생성한 평균적인 레딧 관리자의 모습에 대해 사용자들의 자조 섞인 반응과 고정관념에 대한 토론이 이어짐.

1069126

r/ClaudeCode

요즘 AI 기업들

AI 기업들의 거품 섞인 비즈니스 모델과 IPO 과정을 풍자하는 이미지에 대한 커뮤니티 반응입니다.

113020

r/vibecoding

Claude로 주말 동안 뚝딱 만든 "B2B SaaS" 좀 그만 팔아라

AI로 쉽게 만든 소프트웨어는 더 이상 경쟁 우위가 없으며, 이제는 코드 외의 차별점이 필수적이라는 지적.

25562

커뮤니티 전체 보기