앤스로픽이 호스팅 모델의 지능을 낮췄음을 인정함, 오픈 웨이트 및 로컬 모델의 중요성 입증
핵심 요약
앤스로픽이 서버 부하를 위해 모델 성능을 몰래 낮춘 사실이 드러나며 로컬 모델의 필요성이 강조됨.
- 성능 저하 논란 — 앤스로픽이 서버 부하를 줄이려고 모델의 추론 능력과 설정을 임의로 변경함.
- 투명성 부재 — 사용자에게 알리지 않고 모델 성능을 조정한 행위가 큰 비판을 받음.
- 로컬 모델 대안 — 외부 의존도를 낮추기 위해 직접 호스팅 가능한 오픈 웨이트 모델이 주목받음.
- 비용 효율성 의문 — 성능이 저하된 모델에 동일한 요금을 지불하는 것에 대한 불만이 제기됨.
TL;DR:
3월 4일, UI가 멈춘 것처럼 보이는 긴 지연 시간을 줄이기 위해 Claude Code의 기본 추론 노력을
high에서medium으로 변경했습니다. 이는 잘못된 선택이었습니다. 사용자들이 더 높은 지능을 기본값으로 선호하고 단순 작업에 대해서만 낮은 노력을 선택하고 싶어 한다는 의견을 듣고 4월 7일에 이 변경 사항을 되돌렸습니다. 이는 Sonnet 4.6과 Opus 4.6에 영향을 미쳤습니다.
3월 26일, 사용자가 세션을 재개할 때 지연 시간을 줄이기 위해 1시간 이상 유휴 상태였던 세션에서 Claude의 이전 사고 내용을 삭제하는 변경 사항을 배포했습니다. 버그로 인해 이 작업이 세션의 나머지 기간 동안 매 턴마다 계속 발생하게 되었고, 이로 인해 Claude가 건망증이 심하고 반복적인 것처럼 보이게 되었습니다. 4월 10일에 수정했습니다. 이는 Sonnet 4.6과 Opus 4.6에 영향을 미쳤습니다.
4월 16일, 장황함을 줄이기 위해 시스템 프롬프트 지침을 추가했습니다. 다른 프롬프트 변경 사항과 결합되어 코딩 품질을 저하시켰고 4월 20일에 되돌렸습니다. 이는 Sonnet 4.6, Opus 4.6, Opus 4.7에 영향을 미쳤습니다.
이 각각의 경우에서 그들은 최종 사용자가 전혀 통제할 수 없고 유료 고객에게 변경 사항을 알리지도 않은 채, 품질을 희생하면서 서버 부하를 낮추는 의식적인 선택을 했습니다.
저에게 있어 이는 서비스나 업무를 위해 AI 모델에 의존한다면, 직접 호스팅할 수 있거나 누군가에게 호스팅 비용을 지불할 수 있는 오픈 웨이트 모델을 선택하는 것이 유일하게 제정신인 선택임을 증명합니다.

