r/ClaudeAI•약 2개월 전•3082•553

AI의 황금기는 끝났다

핵심 요약

LLM들의 성능 저하와 품질 하락에 대한 불만과 그에 대한 사용자들의 다양한 의견 공유.

성능 저하 논란 — 주요 LLM들이 이전보다 게으르고 부정확해졌다는 사용자들의 불만 제기
모델 활용 전략 — Sonnet 사용 권장 및 모델 간 교차 검증을 통한 품질 보완 방법 공유
사용자 경험 차이 — 모델의 성능 저하를 체감하는 숙련자와 여전히 유용하게 활용하는 비개발자 간의 의견 대립
대안 모델 기대 — 미국 기업의 모델 통제에 반발하며 오픈 소스 및 해외 모델의 성장에 거는 기대

소비자 및 프로슈머의 LLM 접근성에 대한 황금기는 끝났다고 생각한다. 나는 Claude, ChatGPT, Gemini, Perplexity를 모두 구독 중이다. 4개 모델 모두에 동일한 채팅(텍스트 대화 분석 및 코멘트)을 실행하고 있다. 3주 전만 해도 이건 100% Claude의 영역이었고, 정말 뛰어났다. 하지만 지금은 게으르고, 실수를 저지르며, 제대로 관여하지 않는다. 이건 확실히 측정 가능한 부분이다. 예전에는 응답이 심도 있었고 내가 놓친 부분까지 파악해 냈는데, 지금은 성의 없는 문단만 돌아오고 적극적으로 회피한다(“오, 당신은 나한테 더 필요한 게 없어 보이네요”).

ChatGPT는 터무니없다. 오직 리스트와 불릿 포인트로만 대답하며, 모든 것에 대해 과하게 반응한다(“정말 놀라운 통찰력이에요, 당신은 최고예요!”).

Gemini는… 마을 바보 수준이고 이제는 50%가 환각이다.

Perplexity는 내가 찾는 종류의 통찰력을 제공하기를 거부한다.

이제 끝났다고 본다. 품질을 원한다면 엔터프라이즈 가격을 지불해야 할 것이다. 컴퓨팅 자원 문제일 수도 있지만, 어쩌면 평민들에게는 너무 과한 권력이라서 그럴지도 모른다.

주요 댓글

r/claudeai

모델 성능 저하에 대한 불만과 사용자의 숙련도 차이, 그리고 대안 모델에 대한 기대가 섞인 반응을 보임.

512

Sonnet을 쓰는 게 팁임. Opus는 너무 느리고 토큰만 많이 잡아먹음. 하루 써보고 Sonnet으로 돌아왔는데 다들 불평하는 문제들 안 겪음.

133

난 대부분 Sonnet 쓰고 확인이 필요하면 Opus나 다른 AI한테 줘서 허점 찾게 함. 다른 모델을 공격한다고 생각할 때 더 잘하는 듯.

다른 모델 공격한다는 말 웃기네. VS Code에서 Claude 데스크톱 앱 보여주려고 스크린샷 찍는데 GitHub Copilot 보고는 파일 안 바꿨다고 난리 치길래 내가 바꾼 거 맞다고 하니까 갑자기 태세 전환함... 질투하는 줄 알았음.

오늘 밤에 작업 마무리하면서 외부 AI한테 프로젝트 전체 감사받을 거니까 실수하면 쪽팔릴 거라고 했더니, 한참 생각하다가 '감사 통과'하려고 수정할 목록 10개를 내놓음. 그중 2개는 치명적 오류였고 하나는 사용자 전체한테 열려있던 테이블이었음. 왜 작동하는진 모르겠는데 효과는 있음.

여전히 열등한 제품에 만족하고 있네. Max 플랜에 100달러씩 내는데 품질이 갑자기 1/10 토막 나면 열받아야 정상임. 난 개빡침. 내 프로세스에 다 통합해놨는데 이제는 몇 주 전엔 잘하던 걸 시키려고 시간 다 버림. 결국 제대로 안 돼서 좌절만 함.

189

이건 모든 AI 서브레딧에서 나오는 레퍼토리임. 'Claude/Gemini/ChatGPT 예전엔 좋았는데 왜 이래'. 챗봇뿐만 아니라 이미지 생성기에서도 똑같은 소리 함. 경외감이 사라진 건지, 프롬프트 실력이 늘어서 한계가 더 잘 보이는 건지 모르겠지만 다들 예전이 좋았다고 난리임.

난 반대임. 최근까지 이 기술 쓰레기라고 생각했는데 지금은 엄청 뽑아내는 중. 대단함. 난 소프트웨어 개발자도 아님. 아마 개발자들은 한계까지 밀어붙여서 그런 거고 난 2년 전에도 가능했던 걸 이제 발견하는 중일지도. 토목 건설 쪽인데 Claude로 만드는 것들 보면 미쳤음.

155

맞음. 시간이 지나면서 모델에 의존해서 게을러진 사람들이 모델이 빈틈을 못 채워주면 화내는 거임.

대부분 동의하는데 해외 모델이나 오픈 소스 모델들이 그 빈틈을 채우는 것 같음. 미국 기업들은 지능을 제한하고 싶어 하는데, 국제 시장은 미국 기업들이 하는 것과 반대로(모델 제한 안 하기, 오픈 소스 하기) 대응하기로 한 듯.

혹시 그 '좋은 중국 모델'이 지금 우리 방에 같이 있는 건가요?

Claude만큼 좋은 오픈 소스 모델이 뭐가 있음?

119

1년 뒤면 대부분의 최고급 오픈 소스 모델이 지금의 Claude보다 훨씬 나아질 거임. 멀지 않았음. 코딩과 컴퓨터 작업의 90% 이상을 수행할 수 있고, 우리가 효과적으로 지시할 수 있을 만큼 유능하고 창의적이며 정확해지는 임계점이 오면 오픈 소스의 댐이 터질 거라 믿음. 작년 이맘때 다들 Deepseek 얘기하던 거 기억나지?

Gemini는... 마을 바보 수준이고 50%는 환각임. 😂 인정.

Gemini CLI를 Claude에 연결해서 headless tmux 세션에서 Claude가 호출하게 만듦. 20달러짜리 무료 Gemini 플랜 있어서 활용해 보려고. Claude가 쓴 계획서 검토용으로 Gemini Pro 쓰는데 생각보다 꽤 잘 작동함.

Gemini는 나보고 신이라고 하던데. Claude는 여전히 잘 작동하고 ChatGPT는 틀린 소리도 아주 자신 있게 함. Claude는 가끔 스스로 말 끊으면서 '잠깐, 방금 한 말 틀렸어, 다시 하자' 이러면서 생각할 시간을 갖는 것 같음.