Anthropic, 모든 주요 OS와 브라우저의 제로데이 취약점을 찾아내는 미공개 AI 모델 공개 및 방어자들에게 무료 제공
핵심 요약
Anthropic이 취약점 탐지에 특화된 미공개 모델 'Claude Mythos'를 공개하고 주요 보안 파트너들에게 무료로 제공하기로 함.
- Project Glasswing — Anthropic이 취약점 탐지 및 방어를 위해 주요 기업들과 협력하는 보안 프로젝트를 발표함.
- Claude Mythos Preview — 기존 모델보다 월등한 성능으로 27년 된 취약점까지 찾아내는 미공개 AI 모델임.
- 방어 우선 전략 — 공격자보다 먼저 방어자에게 강력한 도구를 제공하여 전 세계 소프트웨어 보안을 강화하려는 목적임.
- AI의 양면성 — AI가 취약점 발견 속도를 비약적으로 높임에 따라 보안 패치 주기를 앞당겨야 하는 과제가 생김.
Anthropic이 Project Glasswing이라는 것을 발표했는데, 솔직히 제가 본 AI 발표 중 가장 놀랍고도 우려되는 내용 중 하나입니다.
공개적으로는 제공하지 않는 Claude Mythos Preview라는 미공개 모델이 있습니다. 왜냐고요? 소프트웨어 취약점을 찾고 악용하는 능력이 너무 뛰어나기 때문입니다.
제 눈길을 끈 점은 다음과 같습니다:
- OpenBSD(가장 보안이 강력한 OS 중 하나)에서 27년 된 취약점을 찾아내어, 공격자가 연결만으로 원격에서 기기를 충돌시킬 수 있게 함
- 자동화 도구로 500만 번 이상 검사해도 잡히지 않았던 FFmpeg의 16년 된 버그를 코드 한 줄에서 찾아냄
- 리눅스 커널 취약점들을 자율적으로 연결하여 일반 사용자 권한에서 전체 시스템 제어 권한까지 상승시킴
- CyberGym(취약점 재현 벤치마크)에서 83.1%를 기록하여 Opus 4.6의 66.6%를 압도함
- SWE-bench Verified(에이전트 코딩)에서 93.9%를 기록하여 Opus 4.6의 80.8%를 넘어섬
Anthropic이 모은 연합군은 엄청납니다: AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Microsoft, NVIDIA, Palo Alto Networks, 그리고 Linux Foundation이 포함되어 있습니다.
이 모델은 이 파트너들과 중요 인프라를 유지 관리하는 40개 이상의 다른 조직에 제공됩니다. Anthropic은 1억 달러 규모의 사용 크레딧을 약속하고 오픈 소스 보안 조직에 400만 달러를 기부하고 있습니다.
핵심 프레임은 이렇습니다: AI는 이제 거의 모든 인간보다 더 잘 취약점을 찾을 수 있는 임계점을 넘었습니다. 그 능력은 확산될 것입니다. 그러니 공격자들이 비슷한 도구에 접근하기 전에 먼저 방어자들의 손에 쥐여주겠다는 것입니다.
발표에 숨겨진 불편한 진실은, 이런 모델들이 결국 모두에게 공개될 것이라는 점을 사실상 인정하고 있다는 것입니다. 전 세계의 중요한 소프트웨어를 패치할 수 있는 시간은 바로 지금입니다.
여러분은 어떻게 생각하시나요? 이것이 올바른 움직임일까요, 아니면 이렇게 공개적으로 발표하는 것이 상황을 더 악화시키는 것일까요?

