본문 바로가기

일과 생각

Anthropic이 만든 모델을 Anthropic이 출시하지 않았습니다 - Claude Mythos와 Project Glasswing

4월 7일 Anthropic이 새 모델을 발표했습니다.
그런데 발표와 함께 한 가지를 명확히 했습니다. 이 모델은 일반에 공개하지 않겠다는 것입니다.
모델의 이름은 Claude Mythos Preview입니다.
Anthropic이 스스로 "지금까지 만든 가장 강력한 모델"이라고 표현한 바로 그 모델입니다. 
지난 3월 데이터 유출로 존재가 먼저 알려졌고 오늘 공식 발표됐습니다. 
그리고 동시에 일반 출시 계획이 없다는 것도 함께 발표됐습니다.
AI 회사가 새 모델을 공개하면서 스스로 출시를 보류한 것은 이례적인 일입니다.

이유는 하나입니다. 너무 강력하기 때문입니다.
Claude Mythos Preview는 사이버보안 역량에서 기존 모델과 질적으로 다른 수준을 보여줬습니다. 
Anthropic의 기술 블로그에 따르면 이 모델은 완전 자율적으로 
FreeBSD의 17년 된 원격 코드 실행 취약점을 발견하고 익스플로잇했습니다. 
CVE-2026-4747로 분류된 이 취약점은 인증되지 않은 사용자가 인터넷 어디서든 서버 루트 권한을 획득할 수 있게 합니다. 
인간의 개입 없이 발견부터 익스플로잇까지 모두 모델이 수행했습니다.

이것은 하나의 사례가 아닙니다. 
Anthropic은 지난 몇 주 동안 Mythos Preview가 수천 개의 제로데이 취약점을 발견했다고 밝혔습니다. 
모든 주요 운영체제와 웹 브라우저에서 수십 년간 발견되지 않았던 취약점들이 포함됐습니다. 
기존 벤치마크는 이미 거의 포화 상태입니다. 모델이 너무 강해서 측정이 의미 없어진 것입니다.
Anthropic은 내부적으로 이미 미국 정부 관계자들에게 경고를 전달했습니다. 
Mythos가 올해 안에 대규모 사이버 공격 가능성을 크게 높인다는 내용이었습니다.

그래서 Anthropic이 선택한 방식이 Project Glasswing입니다.
프로젝트 이름은 글라스윙 나비(Glasswing Butterfly)에서 왔습니다. 
투명한 날개를 가진 나비처럼 소프트웨어 취약점도 눈에 잘 보이지 않는다는 의미입니다.

구조는 이렇습니다. 
일반에 공개하는 대신에 세계 핵심 소프트웨어 인프라를 담당하는 기관들에게 먼저 접근권을 줍니다. 
공격자보다 방어자가 먼저 이 도구를 써서 취약점을 찾고 패치하게 하는 것입니다.

12개 핵심 파트너 조직에는 Amazon, Apple, Microsoft, Google, Broadcom, 
Cisco, CrowdStrike, JPMorgan Chase, Nvidia, Linux Foundation, Palo Alto Networks이 포함됩니다. 
여기에 더해 약 40개 조직이 추가로 Mythos Preview에 접근할 수 있습니다. 
Anthropic은 사용료에 해당하는 $1억 달러 상당의 크레딧과 
오픈소스 보안 조직에 대한 $400만 달러의 직접 기부를 함께 제공합니다.

저는 이 발표에서 두 가지가 동시에 보입니다.
1) Anthropic이 레드라인을 실제로 지키고 있다는 것입니다. 
지난 2월 국방부 소송에서 Anthropic은 원칙을 지키기 위해 수십억 달러의 계약을 포기했습니다. 
이번에는 가장 강력한 모델을 만들고도 출시를 보류했습니다. 말이 아니라 행동입니다.

2) 이것이 선례가 된다는 것입니다. AI 회사가 안전을 이유로 모델 출시를 스스로 제한한 실질적인 첫 사례입니다. 
Anthropic은 향후 Claude Opus 모델에 새로운 안전장치를 먼저 탑재하고, 
그것이 충분히 검증된 이후에 Mythos급 모델을 단계적으로 확대할 계획이라고 밝혔습니다.

이 결정이 남기는 질문은 하나입니다.
Mythos와 비슷한 수준의 사이버보안 역량은 시간이 지나면 다른 모델에서도 나타날 것입니다. 
Anthropic이 아닌 곳에서나 같은 원칙을 갖지 않은 곳에서도 나타날 수 있습니다. 
Project Glasswing은 그 시점이 오기 전에 방어자가 준비할 시간을 버는 시도입니다.

Anthropic이 스스로 인정했듯이 역량이 확산되는 것은 막을 수 없습니다. 
막을 수 있는 것은 누가 먼저 준비하느냐입니다.