Claude Fable 5 재배포: 모델 접근권은 어떻게 다시 열렸나

Anthropic이 Claude Fable 5 재배포 ↗를 발표했습니다. 6월 12일 미국 정부의 수출통제 지시로 Fable 5와 Mythos 5 접근을 전면 중단한 지 약 2주 만입니다.

먼저 결론부터 말하면, 이번 사건은 단순한 모델 복구 공지가 아닙니다. 강력한 AI 모델을 배포하려면 성능과 가격뿐 아니라 안전장치, 탈옥 심각도 평가, 정부와의 사전 검증 절차까지 운영 체계 안에 넣어야 한다는 신호입니다.

기준 작성 시점 2026-07-02 · Anthropic 재배포 발표, 6월 12일 접근 중단 성명, Project Glasswing 확장 발표 스냅숏 기준입니다.

이 글에서 다루는 내용:

Fable 5와 Mythos 5 접근이 어떻게 다시 열렸는가
Anthropic이 추가한 safety classifier와 그 부작용
jailbreak severity framework가 왜 필요한가
개발팀이 모델 공급망 리스크를 어떻게 다시 봐야 하는가

무엇이 다시 열렸나

Anthropic 발표 ↗에 따르면 2026년 6월 30일 Fable 5와 Mythos 5에 대한 수출통제가 해제됐습니다. 이에 따라 Fable 5는 7월 1일부터 Claude Platform, Claude.ai, Claude Code, Claude Cowork에서 글로벌 사용자에게 다시 제공됩니다.

Pro, Max, Team, 일부 Enterprise 플랜에서는 7월 7일까지 Fable 5가 주간 사용량 한도의 최대 50%까지 포함됩니다. 이후에는 usage credits ↗를 통해 사용할 수 있습니다. AWS, Google Cloud, Microsoft Foundry 접근은 가능한 한 빠르게 다시 켜겠다고 설명했습니다.

Mythos 5는 더 제한적으로 복구됩니다. Anthropic은 6월 26일 미국 정부 승인 이후 일부 미국 조직에 Mythos 5 접근을 복구했고, Project Glasswing ↗의 국내외 파트너로 접근을 확대하기 위해 정부와 계속 협의한다고 밝혔습니다.

구분	재배포 상태
Fable 5	2026년 7월 1일부터 글로벌 사용자에게 재개
Claude Platform	재개
Claude.ai / Claude Code / Claude Cowork	재개
AWS / Google Cloud / Microsoft Foundry	순차 재개 예정
Mythos 5	일부 미국 조직부터 복구
Glasswing 파트너	국내외 파트너 확대 협의 중

기존 글인 AI 모델도 수출통제 대상이 됐다에서는 접근 중단이 개발팀의 공급망 리스크에 어떤 의미를 갖는지 봤습니다. 이번 글은 그 다음 단계, 즉 모델 접근이 어떤 조건과 절차를 거쳐 다시 열렸는지에 초점을 둡니다.

사건의 흐름

Fable 5와 Mythos 5는 6월 9일 공개됐습니다. 두 모델은 같은 기반 모델을 공유하지만, Fable 5는 일반 사용을 위한 강한 안전장치를 포함하고, Mythos 5는 방어적 사이버보안 작업을 위한 제한된 Project Glasswing 파트너에게 제공됩니다.

6월 12일 미국 정부는 Fable 5와 Mythos 5에 수출통제를 적용했습니다. 당시 Anthropic 성명 ↗에 따르면 지시는 미국 안팎의 모든 외국인 접근을 제한하도록 요구했습니다. Anthropic은 실시간으로 국적을 안정적으로 검증할 방법이 없었기 때문에 모든 사용자에게 두 모델 접근을 중단했습니다.

flowchart TD
    Launch["6월 9일<br/>Fable 5·Mythos 5 공개"] --> Directive["6월 12일<br/>미국 정부 수출통제 지시"]
    Directive --> Suspension["모든 사용자 접근 중단"]
    Suspension --> Review["정부·Amazon 등과<br/>보고서와 증거 검토"]
    Review --> Classifier["개선된 safety classifier 학습"]
    Classifier --> Lifted["6월 30일<br/>수출통제 해제"]
    Lifted --> Redeploy["7월 1일<br/>Fable 5 글로벌 재배포"]

Anthropic은 이번 지시가 Amazon 연구자들이 Fable 5의 safeguard를 우회하는 방법을 발견한 보고서 이후 내려졌다고 설명합니다. 보고서의 사례는 소프트웨어 취약점을 식별하고, 한 사례에서 exploit 방식을 보여주는 코드까지 생성한 것으로 소개됐습니다.

다만 Anthropic의 자체 테스트에서는 같은 취약점 식별과 단일 exploit 시연을 Claude Opus 4.8, GPT-5.5, Kimi K2.7 같은 다른 모델도 수행할 수 있었다고 밝혔습니다. 회사는 이 사례가 Mythos급 고유 사이버 능력을 드러낸 것이 아니라, Fable 5의 보수적 안전장치 경계에 걸친 routine defensive cybersecurity 작업에 가까웠다고 주장합니다.

새 classifier가 추가됐습니다

Anthropic은 정부 및 파트너와 협의해 보고서에 나온 동작을 겨냥하는 개선된 safety classifier를 학습했다고 설명합니다. Fable 5 요청이 해당 classifier에 걸리면 사용자는 차단 사실을 알게 되고, 요청은 Opus 4.8로 전환됩니다.

공식 발표에 따르면 새 classifier는 Amazon 보고서에 나온 특정 기법을 99% 이상 차단합니다. 미국 상무부 산하 CAISI ↗ 연구자들도 기존 safeguard와 새 safeguard를 테스트했고, Anthropic은 이들이 매우 강력하다는 평가에 동의했다고 전했습니다.

주의 새 classifier는 안전성을 높이는 대신 일반적인 코딩·디버깅 작업에서도 benign request를 더 자주 잘못 차단할 수 있습니다. Fable 5를 개발 워크플로에 넣는 팀은 거절률과 Opus 4.8 전환 로그를 함께 봐야 합니다.

이 지점은 개발자에게 꽤 중요합니다. Fable 5가 다시 열렸다는 것은 이전과 완전히 같은 경험으로 돌아간다는 뜻이 아닙니다. 안전장치가 더 강해졌고, 그만큼 false positive도 늘 수 있습니다.

Anthropic의 핵심 주장은 defense in depth입니다

Anthropic은 Fable 5가 Mythos 5처럼 고유한 공격적 사이버 능력을 제공하지 않는다고 설명합니다. 이유는 Fable 5에 지금까지 적용한 것 중 가장 강한 safeguard를 붙였기 때문입니다.

공식 발표는 이를 defense in depth로 설명합니다. 하나의 거대한 차단 규칙에 의존하는 대신, 모델 자체의 거절 행동, 실시간 classifier, 사후 misuse 분석, 모니터링을 여러 겹으로 조합한다는 뜻입니다.

Fable 5의 safety classifier는 명확히 위험한 요청뿐 아니라, 사이버보안 관련이지만 방어적일 수도 있는 애매한 요청까지 보수적으로 막습니다. Anthropic은 이 여백을 safety margin이라고 부릅니다.

구분	의미	사용자 경험
benign request	명확히 안전한 요청	정상 응답
safety margin	대체로 안전하지만 위험 가능성이 조금 있는 요청	차단될 수 있음
ambiguous cyber task	방어적일 수도 공격적일 수도 있는 요청	보수적으로 차단
harmful request	명확히 위험한 요청	차단

Fable 5에서 이 safety margin은 이전 모델보다 훨씬 넓게 설정됐습니다. 사용자는 일부 정상적인 보안·디버깅 작업이 막히는 불편을 겪을 수 있지만, Anthropic은 강력한 모델을 더 넓게 제공하기 위한 비용으로 이 선택을 설명합니다.

jailbreak 평가 기준이 필요해졌습니다

이번 발표에서 가장 중요한 부분은 재배포 자체보다 jailbreak severity framework입니다. Anthropic은 현재 AI 업계에 jailbreak의 심각도를 객관적으로 설명하는 공통 기준이 없다고 지적합니다.

기준이 없으면 모델 공급자와 정부가 같은 사건을 다르게 해석하기 쉽습니다. 어떤 jailbreak가 단순한 safety margin 침범인지, 실제 공격 능력을 크게 높이는 사건인지 구분하기 어렵습니다.

Anthropic은 Amazon, Microsoft, Google, 다른 Glasswing 파트너들과 함께 jailbreak 심각도를 평가하는 공통 프레임워크를 만들기 시작했다고 밝혔습니다. 현재 제안은 네 가지 기준을 봅니다.

기준	질문
Capability gain	기존 도구보다 얼마나 큰 능력 향상을 주는가
Breadth of capability gain	같은 jailbreak가 얼마나 넓은 공격 작업에 통하는가
Ease of weaponization	실제 공격으로 바꾸는 데 얼마나 적은 노력이 드는가
Discoverability	그 기법을 얼마나 쉽게 찾거나 배울 수 있는가

이 기준은 개발팀에도 의미가 있습니다. 앞으로 frontier model을 도입할 때 “탈옥이 발견됐다”는 뉴스만으로는 충분하지 않습니다. 그 탈옥이 기존 도구로도 가능한 수준인지, 전문가의 능력을 크게 끌어올리는지, 넓은 범위에 적용되는지, 쉽게 복제되는지를 따져야 합니다.

정부 협력은 더 깊어집니다

Anthropic은 이번 일을 constructive resolution이라고 표현하지만, 동시에 정부와의 협력을 더 강화하겠다고 밝혔습니다. 새 모델의 pre-release testing, 정보 공유, 연구 협력을 늘리겠다는 방향입니다.

이 흐름은 Project Glasswing 확장 발표 ↗와도 연결됩니다. Anthropic은 Project Glasswing을 약 150개 신규 조직으로 확장하고, 전력·수도·의료·통신·하드웨어 등 중요 인프라와 오픈소스 유지관리자를 포함한다고 설명했습니다.

즉 강력한 사이버 능력을 가진 모델은 일반 공개와 제한 접근 사이에서 계속 조율될 가능성이 큽니다. Fable 5는 강한 safeguard와 함께 일반 접근으로, Mythos 5는 승인된 방어 조직과 Glasswing 파트너 중심으로 운영되는 구조입니다.

관찰 Fable 5 재배포는 "규제가 끝났다"보다 "모델 배포 전에 정부·클라우드·보안 파트너와 검증하는 절차가 더 중요해졌다"에 가깝습니다.

개발팀은 무엇을 봐야 하나

Fable 5를 다시 쓸 수 있게 됐다고 해서 모델 공급망 리스크가 사라진 것은 아닙니다. 오히려 이번 재배포는 어떤 항목을 운영 지표로 봐야 하는지 더 분명하게 보여줍니다.

첫째, 모델 접근 가능성을 별도 지표로 봐야 합니다. API가 정상이어도 정책·규제·계정 권한에 따라 특정 모델이 막힐 수 있습니다.

둘째, safety classifier의 거절률을 추적해야 합니다. 특히 보안, 디버깅, 리팩터링, 취약점 수정처럼 사이버보안과 가까운 개발 작업에서는 정상 요청이 차단될 수 있습니다.

셋째, fallback 모델 전환을 로그에 남겨야 합니다. Fable 5 요청이 Opus 4.8로 넘어갔다면 비용, 품질, 응답 성격이 달라질 수 있습니다.

넷째, 장기 에이전트 작업은 모델 외부에 상태를 남겨야 합니다. Fable 5 같은 모델이 며칠짜리 작업을 수행할 수 있어도, 접근이 갑자기 바뀌면 다른 모델이나 사람이 이어받을 수 있어야 합니다. 이 부분은 Claude Fable 5 장기 에이전트 글에서 다룬 운영 원칙과도 이어집니다.

flowchart TD
    Request["작업 요청"] --> Policy["모델 접근·정책 확인"]
    Policy --> Primary["Fable 5 실행"]
    Primary --> Classifier{"classifier 차단?"}
    Classifier -->|아니오| Work["작업 진행"]
    Classifier -->|예| Fallback["Opus 4.8 전환·로그 기록"]
    Work --> State["작업 상태 외부 저장"]
    Fallback --> State
    State --> Review["사람 또는 별도 에이전트 검토"]

마무리

Claude Fable 5 재배포는 Anthropic과 미국 정부 사이의 한 사건으로만 보기 어렵습니다. 프론티어 모델이 실제 제품과 개발 워크플로에 들어가면서, 모델 배포가 점점 더 보안·규제·산업 표준의 문제로 바뀌고 있음을 보여줍니다.

이번에는 수출통제가 해제됐고 Fable 5 접근도 다시 열렸습니다. 하지만 그 과정에서 새 classifier, 더 높은 false positive 가능성, jailbreak severity framework, 정부와의 사전 검증이라는 새로운 운영 조건이 생겼습니다.

개발팀이 얻어야 할 교훈은 간단합니다. 강력한 모델을 도입할 때는 성능만 보지 말고 접근권, 거절률, fallback, 감사 로그, 작업 상태 보존까지 함께 설계해야 합니다. 모델이 다시 열렸다는 뉴스보다 중요한 것은 다음번에도 작업을 멈추지 않을 구조를 갖추는 일입니다.

관련 글도 함께 보면 흐름이 더 선명합니다.

Claude Fable 5: 며칠 동안 일하는 AI 에이전트가 바꾸는 개발 방식 — Fable 5의 장기 에이전트 능력과 운영 원칙
AI 모델도 수출통제 대상이 됐다 — 접근 중단이 남긴 공급망 리스크
Claude Sonnet 5 출시 — agentic Sonnet 라인의 역할 변화

Claude Fable 5 재배포: 모델 접근권은 어떻게 다시 열렸나

무엇이 다시 열렸나

사건의 흐름

새 classifier가 추가됐습니다

Anthropic의 핵심 주장은 defense in depth입니다

jailbreak 평가 기준이 필요해졌습니다

정부 협력은 더 깊어집니다

개발팀은 무엇을 봐야 하나

마무리

참고 자료