Claude Opus 4.7은 진짜 쓰레기다

핵심 요약

Claude Opus 4.7 버전의 성능 퇴보와 심각한 환각 현상에 대한 불만 토로.

성능 퇴보 — Opus 4.5 대비 4.7 버전의 정확도와 속도가 현저히 떨어짐.

환각 현상 — 존재하지 않는 기술(DirectML 등)을 언급하며 잘못된 원인 분석을 내놓음.

응답 중단 — 답변이 완료되지 않은 상태에서 20분마다 응답이 끊기는 문제 발생.

대안 사용 — 현재 CODEX PRO PLAN이 더 안정적이고 정확하게 작동함.

믿기 힘들 정도다... Opus 4.1조차 이것보다는 똑똑하게 느껴졌다. 7개월째 같은 프로젝트를 진행 중인데, 기업용 CV 시스템 관련 작업이다. AI 덕분에 코딩 속도가 빨라졌지만, 특히 CUDA와 TensorRT 작업에서 Opus 4.5의 극강의 속도와 정확도를 경험한 이후로 정점을 찍었다고 느꼈다. 지난 3주 동안 Opus 4.6은 정말 끔찍했고, Opus 4.7은 더 심각하다... 환각을 일으키고 있다. 7개월 동안 써온 것과 똑같은 프롬프트를 사용 중이고, .MD 파일이 과부하된 것도 아니다. 7개월 내내 같은 프로젝트에 같은 프롬프트를 썼는데, 이번에는 MAX-Reasoning 레벨에서 미친 듯이 환각을 일으킨다. 회사에서 비용을 전액 부담하니까 API나 플랜 비용은 상관없다. 예를 들어, Opus 4.6부터는 우리가 .engine 파일을 DirectML에 로드하고 있다는 이유로 추론 값이 나빠졌다고 환각을 일으킨다. 그래 OPUS, DirectML에 .engine 파일이라니. 더 웃긴 건 제대로 확인하거나 작업을 수행하지도 않고 2분마다 소리를 지른다는 거다: 근본 원인 발견! 근본 원인 발견! 추론이 느려진 건 DirectML 값을 FP16 대신 FP32로 올렸기 때문이야! 우린 DirectML을 전혀 안 쓴다고, 젠장, 그냥 .engine FP32일 뿐인데...

모델이 이렇게 된 건 정말 수치스러운 일이다. 12월부터 1월 말/2월 중순까지의 Opus 4.5는 정말 최고였다.

참고로 난 유럽 시간대에서 일하고, 보통 오전 7시부터 오후 2시까지라 서버 과부하 같은 건 겪지 않는다. 그냥 정말 오류가 많아졌고, 답변이 끝나지도 않았는데 20분마다 끊기는 등 포기한 것 같다. 현재는 CODEX PRO PLAN을 더 자주 사용 중이다. CODEX는 내 작업 환경에서 엄청나게 느리지만, 지금까지 단 한 번의 오류도 없이 100% 정확하게 작동하고 있다.

Claude Opus 4.7은 진짜 쓰레기다

핵심 요약

주요 댓글

지금 같이 볼 만한 글

요즘 AI 기업들

ChatGPT가 역사상 가장 빠르게 월간 활성 사용자 10억 명을 달성한 앱이 되었습니다.

어느 쪽이 더 잘했나?

주요 댓글

지금 같이 볼 만한 글

요즘 AI 기업들

ChatGPT가 역사상 가장 빠르게 월간 활성 사용자 10억 명을 달성한 앱이 되었습니다.

어느 쪽이 더 잘했나?