Project Glasswing을 진행하며 지금까지 파악한 내용을 처음으로 공유합니다.
지난달, 저희는 Project Glasswing을 출범했습니다. 점점 강력해지는 AI 모델이 공격 수단으로 악용되기 전에, 세계에서 가장 중요한 소프트웨어를 선제적으로 보호하기 위한 협력 프로젝트입니다.
그 이후, 저희와 약 50개 파트너사는 Claude Mythos Preview를 활용해 전 세계 핵심 소프트웨어에서 1만 건 이상의 높음(high) 또는 심각(critical) 등급 취약점을 발견했습니다. 과거에는 새로운 취약점을 얼마나 빠르게 찾아내느냐가 소프트웨어 보안의 병목이었습니다. 이제는 AI가 대량으로 발견한 취약점을 얼마나 빠르게 검증하고, 공개하고, 패치하느냐가 새로운 병목이 되었습니다.
이 글에서는 Project Glasswing 초기 몇 주간의 경험을 통해 사이버보안 분야의 핵심 과제로 떠오른 이 문제에 대해 파악한 내용을 공유합니다. Mythos Preview의 성능에 관한 초기 공개 데이터, 수천 개의 오픈소스 프로젝트를 스캔한 초기 결과, 그리고 이러한 진전이 오늘날의 사이버 방어에 갖는 의미를 중점적으로 다룹니다. 아울러 Project Glasswing의 향후 계획과 Mythos급 모델의 향후 공개 방향에 대한 저희의 구상도 함께 소개합니다.
소프트웨어 업계의 오랜 관행에 따르면, 새로운 취약점은 발견 후 90일이 지난 시점에 공개합니다. 단, 90일 이전에 패치가 배포된 경우에는 패치 공개 후 약 45일 뒤에 취약점을 공개합니다. 이는 공격자가 취약점을 악용하기 전에 최종 사용자가 소프트웨어를 업데이트할 시간을 확보하기 위한 조치입니다. 저희의 조율된 취약점 공개(Coordinated Vulnerability Disclosure) 정책도 이 원칙을 따르고 있습니다.
다만, 이런 이유로 공개된 취약점은 AI 모델의 사이버 역량이 빠르게 발전하는 추세를 후행적으로 반영할 수밖에 없습니다. 현 시점에서 파트너사들이 Mythos Preview로 발견한 내용을 상세히 공개하면 최종 사용자에게 위험이 될 수 있어, 아직 그 단계에 이르지 못했습니다. 대신, 모델의 성능을 보여주는 구체적인 사례와 지금까지의 진행 상황을 집계한 통계를 제공합니다. Mythos Preview가 발견한 취약점에 대한 패치가 광범위하게 배포된 이후에는 파악한 내용을 훨씬 상세하게 공개할 예정입니다.
Project Glasswing의 초기 파트너사들은 인터넷 및 기타 핵심 인프라의 근간을 이루는 소프트웨어를 개발·운영하는 기업들입니다. 이들의 코드에서 결함을 해소하면 해당 소프트웨어에 의존하는 수많은 조직의 위험이 줄어들고, 나아가 수십억 최종 사용자의 보안도 향상됩니다.
한 달이 지난 현재, 대부분의 파트너사는 각자의 소프트웨어에서 수백 건의 심각 또는 높음 등급 취약점을 발견했으며, 전체 합산으로는 수만 건을 넘어섰습니다. 일부 파트너사는 버그 발견 속도가 10배 이상 빨라졌다고 전하기도 했습니다. 예를 들어 Cloudflare는 핵심 시스템 전반에서 2,000건의 버그를 발견했으며, 이 중 400건은 높음 또는 심각 등급에 해당합니다. Cloudflare 팀은 오탐(false positive) 비율도 사람 테스터보다 낮다고 평가했습니다.
이는 외부 테스터들이 경험한 Mythos Preview의 성능, 그리고 최근 추가 평가 결과와도 일치합니다.
전반적으로, 패치된 소프트웨어의 배포 속도가 눈에 띄게 빨라지고 있습니다. Palo Alto Networks의 최신 릴리스에는 평소보다 5배 이상 많은 패치가 포함되었습니다. Microsoft는 새로 배포할 패치 수가 "한동안 계속 늘어날 것"이라고 밝혔으며, Oracle도 자사 제품과 클라우드 전반에서 기존보다 몇 배 빠른 속도로 취약점을 발견하고 수정하고 있습니다.
Mythos Preview는 다른 유형의 보안 업무에서도 유용성을 입증했습니다. 예를 들어, Glasswing 파트너 은행 중 한 곳에서는 공격자가 고객 이메일 계정을 탈취하고 스푸핑 전화를 건 사고가 발생했는데, Mythos Preview가 150만 달러 규모의 사기성 전신환을 감지해 차단하는 데 기여했습니다.
Anthropic은 지난 몇 달간 Mythos Preview를 활용해 1,000개 이상의 오픈소스 프로젝트를 스캔해 왔습니다. 이 프로젝트들은 인터넷의 상당 부분, 그리고 저희 자체 인프라의 상당 부분을 떠받치고 있습니다.
현재까지 Mythos Preview는 이 프로젝트들에서 높음 또는 심각 등급으로 추정되는 취약점 6,202건을 발견했습니다(중간 및 낮음 등급 포함 시 전체 23,019건).
높음 또는 심각 등급으로 분류된 취약점 중 1,752건은 6개의 독립 보안 연구 기관 중 하나가, 일부는 저희가 직접 면밀히 검토했습니다. 검토 결과, 90.6%(1,587건)가 실제 취약점(true positive)으로 확인되었고, 62.4%(1,094건)는 높음 또는 심각 등급으로 최종 확정되었습니다. 즉, Mythos Preview가 추가 취약점을 전혀 발견하지 않더라도, 현재의 검증 후 실제 취약점 비율을 적용하면 오픈소스 코드에서 높음 또는 심각 등급 취약점을 약 3,900건 이상 발굴한 셈이며, 이는 Project Glasswing 파트너사에서 발견한 취약점과는 별도입니다. 물론 저희는 앞으로도 오픈소스 코드 스캔을 계속할 예정이므로, 이 수치는 계속 늘어날 것으로 예상합니다.
Mythos Preview가 발견한 오픈소스 취약점 중 주목할 만한 사례는 wolfSSL에서 발견된 것입니다. wolfSSL은 보안성으로 잘 알려진 오픈소스 암호화 라이브러리로, 전 세계 수십억 기기에서 사용됩니다. Mythos Preview는 공격자가 인증서를 위조할 수 있는 익스플로잇을 직접 구성해냈으며, 이를 통해 예컨대 은행이나 이메일 서비스 제공자를 사칭한 가짜 웹사이트를 운영할 수 있습니다. 해당 웹사이트는 공격자가 통제함에도 불구하고 최종 사용자에게는 정상 사이트로 보입니다. 이미 패치된 이 취약점(CVE-2026-5194)에 대한 전체 기술 분석은 수 주 내로 공개할 예정입니다.
앞서 언급했듯이, 이러한 버그를 수정하는 데 있어 병목은 분류(triage), 보고, 패치 설계와 배포를 담당하는 사람의 처리 역량입니다. 취약점을 찾는 일 자체는 Mythos Preview 덕분에 훨씬 수월해졌습니다. 아래에 저희가 스캔한 오픈소스 취약점 현황 대시보드를 마련했습니다. 이 대시보드는 공개 프로세스의 각 단계를 보여주며, 시간 경과에 따른 진행 상황을 추적합니다. Mythos Preview가 처음에 높음 또는 심각 등급으로 추정한 취약점만이 아닌, 모든 심각도의 취약점을 포함합니다. 각 단계마다 숫자가 가파르게 줄어드는 것을 확인할 수 있는데, 이는 취약점 하나하나를 검증하고 수정하는 데 필요한 인적 노력의 규모를 반영합니다.

취약점 분류 프로세스는 상당히 공을 들여야 하는 작업입니다. 먼저 저희나 협력하는 외부 보안 전문 기관 중 한 곳에서 Mythos가 발견한 문제를 재현하고 심각도를 재평가합니다. 취약점이 실제로 존재함을 확인한 후에는 이미 적용된 수정 사항이 있는지 점검하고, 소프트웨어 메인테이너에게 상세 보고서를 작성해 전달합니다. 이 과정에서 각별한 주의를 기울이고 있습니다. 오픈소스 소프트웨어 유지·관리의 일반적인 어려움에 더해, 메인테이너들은 최근 품질이 낮은 AI 생성 버그 리포트가 쏟아지는 문제에도 시달리고 있기 때문입니다. 실제로 여러 메인테이너들이 현재 처리 역량이 심각하게 부족한 상황이라고 전해왔으며, 일부는 패치를 설계할 시간이 더 필요하다며 저희의 공개 속도를 늦춰달라고 요청하기도 했습니다. (Mythos Preview가 발견한 높음 또는 심각 등급 버그 하나를 패치하는 데는 평균 2주가 걸립니다.)
메인테이너의 요청에 따라 추가 검토 없이 버그를 직접 공개하는 경우도 있습니다. 현재까지 이렇게 검증 없이 공개한 버그는 1,129건이며, 이 중 Mythos Preview가 높음 또는 심각 등급으로 추정한 것은 175건입니다.
현재까지 메인테이너에게 공개한 높음 또는 심각 등급 버그는 530건으로 추산됩니다. 직접 공개 건의 경우 Claude의 심각도 평가를, 가능한 경우에는 메인테이너나 보안 파트너의 평가를 기준으로 산정한 수치입니다. 이 외에도 동일한 방식으로 높음 또는 심각 등급으로 추정된 확인 취약점 827건은 최대한 신속하게 공개하는 것을 목표로 하고 있습니다.
공개한 530건의 높음 또는 심각 등급 버그 중 75건이 현재 패치 완료되었으며, 그 중 65건에 대한 공개 보안 권고문이 발행되었습니다. 패치 수가 아직 상대적으로 낮은 데에는 세 가지 이유가 있습니다. 첫째, 저희의 조율된 취약점 공개 정책에서 정한 90일 기간이 아직 초기 단계에 있어, 곧 더 많은 패치가 배포될 것으로 예상됩니다. 둘째, 공개 권고문 없이 패치되는 취약점이 있어 실제 패치 수가 저평가되고 있을 수 있습니다. 이 경우 Claude를 이용해 패치 여부를 직접 스캔해야 합니다. 셋째, 낮은 패치 수는 진짜 문제를 반영하기도 합니다. 저희가 상대적으로 느린 속도로 취약점을 공개하고 있음에도, Mythos Preview는 이미 과부하 상태인 보안 생태계에 추가적인 부담을 주고 있습니다.
취약점을 찾기는 쉬워진 반면 수정하기는 여전히 어렵다는 이 간극은 사이버보안에 있어 중대한 과제입니다. 이 과제를 성공적으로 해결해낸다면, 소프트웨어는 지금보다 훨씬 안전해질 것입니다. 아래에서는 사이버 방어자들이 이 새로운 현실에 적응할 수 있는 몇 가지 방법을 소개합니다.
Mythos Preview와 유사한 사이버보안 역량을 갖춘 모델들이 곧 더 광범위하게 보급될 것입니다. 이러한 모델들이 생성하는 대규모 발견 사항을 소프트웨어 업계가 함께 관리하기 위한 보다 폭넓은 노력이 절실히 필요합니다.
현재는 취약점의 발견, 패치 생성, 그리고 최종 사용자에게 패치가 널리 배포되는 시점 사이에 상당한 시차가 존재하는 경우가 많습니다. 이 공백이 공격자에게 핵심 소프트웨어를 악용할 여지를 줍니다. Mythos급 모델은 취약점 발견과 악용에 드는 시간과 비용을 크게 줄여, 이러한 시차에 따른 위험을 더욱 증폭시킵니다. 궁극적으로 Mythos급 모델은 개발자가 배포 전에 버그를 잡아낼 수 있게 해줌으로써 훨씬 안전한 소프트웨어를 구축하는 데 기여할 것입니다. 하지만 취약점이 빠르게 발견되는 반면 패치는 더디게 이루어지는 이 과도기에는 새로운 위험이 도사리고 있습니다.
소프트웨어 개발자와 사용자는 지금 당장 이러한 위험에 대한 노출을 줄이기 위해 행동해야 합니다. 아래의 권고사항은 새로운 내용이 아니며, Anthropic을 비롯한 많은 연구자들이 현재 더 나은 장기적 해법을 연구하고 있습니다. 그 전까지는 기본기를 확실히 지키는 것이 중요합니다.
Mythos Preview만큼 정교한 취약점을 발견하거나 동등한 수준으로 익스플로잇하지는 못하더라도, 현재 일반에 공개된 많은 모델들도 이미 상당수의 소프트웨어 취약점을 발견할 수 있습니다. Project Glasswing은 이미 많은 조직들이 자체 코드베이스에 이러한 모델들을 적용하도록 촉진했으며, 저희는 이 과정을 훨씬 쉽게 만들기 위해 노력하고 있습니다.
먼저, Claude Enterprise 고객을 대상으로 Claude Security를 공개 베타로 출시했습니다. 팀이 코드베이스의 취약점을 스캔하고 수정 방안을 자동으로 제안받을 수 있는 도구입니다. 출시 후 3주 만에 Claude Opus 4.7을 활용해 2,100건 이상의 취약점이 패치되었습니다. (앞서 설명한 오픈소스 패치보다 속도가 빠른 것은, 기업들이 자체 코드를 직접 수정하는 반면 오픈소스 수정은 보통 조율된 공개 프로세스를 거치는 자원봉사 메인테이너들에 의해 이루어지기 때문입니다.)
또한 사이버 검증 프로그램(Cyber Verification Program)도 시작했습니다. 취약점 연구, 침투 테스트, 레드팀 활동 등 합법적인 사이버보안 목적으로 저희 모델을 사용하는 보안 전문가들이 사이버 악용 방지를 위한 일부 안전장치의 제약 없이 활용할 수 있도록 하는 프로그램입니다.
이제 저희는 Mythos Preview와 함께 저희와 파트너사들이 사용했던 도구들을 자격을 갖춘 고객의 보안팀에 요청 기반으로 제공합니다. 목표는 번거로운 초기 설정 없이도 고성능의 공개 모델에서 최상의 결과를 쉽게 얻을 수 있도록 하는 것입니다. 이번 공개 내용은 다음과 같습니다.
Project Glasswing 파트너사 중 하나인 Cisco는 최근 Foundry Security Spec을 오픈소스로 공개해, 다른 방어자들이 자체 평가 시스템을 구축하는 데 참고할 수 있도록 했습니다.
저희는 오픈소스 보안 재단(Open Source Security Foundation)의 Alpha-Omega 프로젝트와 파트너십을 맺었습니다. 이를 통해 메인테이너들이 버그 리포트를 처리하고 분류하는 것을 지원하는 재단의 활동을 돕겠습니다. 또한 프론티어 모델의 역량이 사이버 방어자를 가장 효과적으로 지원하는 방법에 관한 연구도 계속해서 발표할 예정입니다.
저희는 또한 프론티어 AI 모델의 익스플로잇 개발 역량을 시간에 따라 추적할 수 있는 두 가지 새로운 벤치마크인 ExploitBench와 ExploitGym의 개발을 지원했습니다. 자세한 내용은 여기에서 확인하실 수 있습니다. 외부 연구자 접근 프로그램(External Researcher Access Program)을 통해 다른 고품질 정량 벤치마크 개발도 지원하고 있습니다. 마지막으로 Claude for Open Source는 메인테이너와 기여자들을 지원하며, 저희는 앞으로 직접 도입하는 모든 오픈소스 패키지를 스캔하겠다고 약속합니다.
AI의 발전 속도를 고려하면, Mythos Preview에 버금가는 역량을 갖춘 모델이 곧 여러 AI 기업에 의해 개발될 것입니다. 현재로서는 Anthropic을 포함한 어떤 기업도 이러한 모델이 악용되어 심각한 피해를 초래하는 것을 충분히 막을 수 있는 안전장치를 완성하지 못했습니다. 저희가 Mythos급 모델을 아직 일반에 공개하지 않은 이유가 바로 여기에 있습니다. 동시에 이것이 Project Glasswing을 시작한 이유이기도 합니다. 이러한 안전장치 없이 유사한 역량의 모델이 공개된다면, 머지않아 전 세계 거의 누구나 손쉽고 저렴하게 취약한 소프트웨어를 악용할 수 있게 될 것입니다.
Glasswing은 가장 핵심적인 사이버 방어자들이 비대칭적 우위를 확보하도록 돕습니다. 그러나 가능한 한 많은 조직이 사이버 방어 체계를 강화하는 것이 시급히 필요합니다. 저희가 제공하는 일반 공개 모델과 이를 뒷받침하는 새로운 도구, 리소스, 연구 결과들이 이러한 조직들의 사이버보안 역량 강화에 기여하기를 바랍니다.
앞으로는 미국 정부와 동맹국 정부를 포함한 핵심 파트너들과 협력해 Project Glasswing의 참여 파트너를 확대해 나갈 것입니다. 그리고 필요한 보다 강력한 안전장치 개발을 완료한 시점에, Mythos급 모델을 일반에 공개하기를 기대합니다.
이 모든 위험을 넘어선 곳에는 희망적인 미래가 기다리고 있습니다. 중요한 코드가 지금보다 훨씬 단단하게 보호되고, 해킹이 훨씬 드문 세상입니다. 넘어야 할 장벽이 많지만, Project Glasswing이 그 길을 여는 데 기여할 수 있다고 저희는 확신합니다.