추상화된 모델 라우팅 네트워크. 여러 AI 모델 노드가 라우팅 계층을 통해 AI Agent에 연결되어 모델 불확실성 속 인프라 회복력을 상징

Cursor에서 Claude Code로 개발하는 한국 개발자 커뮤니티에서도 비슷한 제보가 쏟아졌습니다.모델 선택기에서 Fable 5가 사라졌다.전날까지 돌아가던 Agent 작업이 다음 날 model not found로 멈추거나, 알아채기 전에 다른 모델로 조용히 바뀌어 출력 품질이 떨어집니다. 공식 공지도, 복귀 일정도 없습니다.

Fable 5 소실 자체는 일회성 뉴스가 아닙니다. 진짜 문제는대부분 팀의 AI Agent 인프라가 ‘모델 불안정’에 전혀 대비하지 않았다는 점입니다. 인터뷰한 현장에서는 Agent 설정에 모델명을 하드코딩하고 fallback이 없는 비율이 70%를 넘었습니다. 모델이 내려가면 자동화 파이프라인 전체가 멈추고, 복구까지 중앙값 2~6시간, 수동 개입이 필요했습니다. 본문은 Fable 5 사건을 출발점으로 모델 변동이 Agent에 주는 실제 피해와, Model Router(OpenRouter) + Cloud Mac Runtime으로 단일 모델 의존을 끊는 설계를 다룹니다.

TL;DR: 설정에 모델명 하드코딩 + fallback 없음 → 목록 제거 후 복구 중앙값 약 3.5시간. 먼저 OpenRouter fallback 체인(5분 설정). Agent를 24×7 돌려야 하면 Cloud Mac 상시 Runtime 추가.

1. 무슨 일이 있었나: Fable 5의 등장과 소실

Fable 5는 Anthropic Claude 5 계열의 ‘Fable’ 버전으로, 내부 ID는 claude-fable-5입니다. high-thinking 모드를 갖추고 복잡한 추론·장문맥 코드 작업에서 호평을 받았습니다. Cursor 모델 목록에 뜨자마자 한국의 스타트업·사이드 프로젝트 개발자들 사이에서도 시험 사용이 확산됐습니다. 같은 시기 Sonnet·Opus 대비 멀티스텝 Agent(크로스 파일 리팩터, 테스트 생성 등) 완료율이 눈에 띄게 높다는 피드백이 많았습니다.

하지만 이용 가능 기간은 매우 짧았고, 예고 없이 Cursor 목록에서 사라졌습니다. Anthropic API를 직접 호출하는 사용자에게도 model_not_found가 보고됐습니다. AI 플랫폼에서는 흔한 일이지만, 모델이 사라져도 이미 그에 의존해 돌던 Agent는 깔끔하게 종료되지 않습니다——예상 밖 방식으로 깨집니다.

Fable 5 소실의 추정 원인

공식 설명은 없지만 플랫폼 동작으로 보면 다음 가능성이 있습니다.

원인 유형설명가능성
용량 통제 high-thinking은 연산 비용이 커 전 사용자에게 안정 공급 불가, 임시 목록 제거 높음
버전 관리 그레이·내부 테스트 단계에서 품질 조정을 위해 공개 일시 중단 중간
API 스펙 변경 model_id·API 버전 갱신으로 구 ID 무효화, 이전 통지 누락 중간
안전·컴플라이언스 특정 출력이 내부 임계값 초과, 수정까지 임시 목록 제거 낮음

이유가 무엇이든 사용자 입장 결과는 같습니다.설정해 둔 Agent가 그 모델을 더 이상 호출할 수 없습니다. 그리고 보통 사전에 알려주지 않습니다.

2. 모델 소실의 파괴력은 예상보다 큼

IDE에서 대화하며 코딩할 때는 모델이 사라져도 에러를 보고 수동으로 바꾸면 몇 분 안에 복귀합니다. AI Agent는 다릅니다.

Agent는다단계 작업을 자율 실행합니다. 한 줄씩 승인받는 게 아니라 백그라운드에서 모델 호출·도구 실행·중간 결과 전달을 반복합니다. 체인 어디든 의존 모델을 잃으면 전체가 끊깁니다. 실패가 명확한 에러가 아닌 경우가 많습니다.

  • 조용한 강등: 주 모델 불가 시 다른 모델로 자동 전환. Agent는 계속 돌지만 품질이 떨어져 잘못된 코드·판단이 몇 스텝 뒤에 드러남
  • 중간 상태 행(hang): 타임아웃으로 특정 스텝에 머물고 성공·실패 모두 명시되지 않아 로그를 뒤져야 발견
  • 연쇄 실패: Fable 5에 의존한 하위 Agent 실패 → 상위 Agent 재시도 → 한도 초과로 워크플로 전체 실패. 완료분 롤백은 보장되지 않음
  • 컨텍스트 손실: 재시작 시 리뷰 결과·중간 판단이 사라져 재구축에 많은 토큰과 시간 소모
현장 데이터: 여러 팀 사례에서 모델이 목록에서 제거되어 인한 Agent 복구 시간 중앙값은 3.5시간. 약 1.5시간은 조용한 실패 발견, 약 2시간은 설정 변경·재실행의 수동 작업입니다.

3. Agent 의존 체인 단절: 한 줄 설정에서 워크플로 붕괴까지

원인은 종종 무해해 보이는 설정 한 줄입니다. Claude Code와 대부분 Agent 프레임워크는 모델명을 문자열로 씁니다.

// .claude/settings.json (hardcoded model)
{
  "model": "claude-fable-5-thinking-high",
  "tools": ["bash", "computer", "text_editor"]
}

Fable 5가 살아 있을 때는 문제없습니다. 목록 제거 후에는 Claude Code 인스턴스가 모델 초기화에 실패하고 이후 Agent 동작이 모두 멈춥니다.

전형적인 단절 경로

「자동 Code Review + PR 수정」Agent가 모델 목록 제거 후 어떻게 깨지는지——간략 버전입니다.

# Agent workflow (simplified)
Step 1: Fetch PR diff                    → OK (no model)
Step 2: Call claude-fable-5 on diff      → FAIL (model not found)
Step 3: Generate fix suggestions         → SKIP (depends on step 2)
Step 4: Post review comment              → SKIP
Step 5: Send Slack notification          → Silent fail

Result: PR stuck in queue; dev thinks review is still running

5단계에 주목하세요. Slack 알림도 실패해 개발자는 경보를 받지 못합니다. 체인 중간이 끊기고 양끝은 정상처럼 보이는——이게 ‘조용한 크래시’의 전형입니다.

문제의 핵심

리스크증상근본 원인
모델명 하드코딩 설정에 claude-fable-5 직접 기입 모델 추상화 계층 부재
fallback 없음 주 모델 실패 시 즉시 에러, 대체 경로 없음 fallback 체인 미설정
가용성 감지 없음 호출 실패까지 모델 불가를 모름 Model Health Check 부재
비영속 런타임 MacBook 슬립 후 전환 신호를 받지 못함 상시 가동 Runtime 부족

4. 개인 개발자에게 미치는 영향

개인·소규모 팀에게 Fable 5 소실의 직접 손실은시간 비용이 중심입니다. 금전보다 과소평가되기 쉽지만, 사이드 프로젝트·1인 창업에서는 치명적일 수 있습니다.

전형적인 손실 시나리오

Claude Code로 풀스택 개발하는 개인 개발자 예:

  • 금요일 밤 「API 레이어 리팩터 + 테스트 생성」Agent를 Cloud Mac에서 기동
  • 토요일 아침 3단계에서 정지. Fable 5는 새벽 2시에 이미 목록에서 제거됨, 6시간 조용히 행
  • 컨텍스트 백업 없음. 재실행에 프로젝트 배경 재입력, 약 15만 토큰 소모
  • Sonnet 전환 후 품질 하락, 수동 리뷰에 1~2시간 추가

합계: 유효 작업 시간 약 8시간 + 추가 토큰. 주말 배포를 앞둔 1인 개발자에게 큰 대가입니다.

개인용 최저 비용 대응

대규모 인프라는 필요 없습니다. 다음 3가지로 리스크 80%를 줄일 수 있습니다.

// Option 1: OpenRouter instead of direct Anthropic API
// .claude/settings.json
{
  "model": "openrouter/anthropic/claude-sonnet-4-5",
  "apiKey": "sk-or-...",
  "fallback": [
    "openrouter/anthropic/claude-haiku-4-5",
    "openrouter/meta-llama/llama-3.1-70b"
  ]
}
# Option 2: model health check in task script
MODEL="claude-fable-5-thinking-high"
FALLBACK="claude-sonnet-4-5"

if ! claude --model "$MODEL" --ping 2>/dev/null; then
  echo "[WARN] $MODEL unavailable, switching to $FALLBACK"
  MODEL="$FALLBACK"
fi

claude --model "$MODEL" -p "Start task..." 
개인 개발자 TL;DR: 설정의 모델명을 OpenRouter 라우트로 바꾸고 fallback 목록을 추가하세요. 추가 비용은 거의 없고(무료 티어로 개인 사용 충분), 목록에서 제거되어 인한 중단을 ‘수시간’에서 ‘초 단위 자동 전환’으로 줄입니다.

5. 팀 AI Agent 인프라에 미치는 영향

개인이 시간을 잃는 반면 팀이 맞닥뜨리는 건프로덕션급 신뢰성 리스크입니다. Agent가 Code Review 자동화, PR 머지 보조, 테스트 생성, 문서 업데이트를 맡으면 모델 목록 제거는 개발 파이프라인 전체 처리량을 떨어뜨립니다.

팀에서 흔한 3가지 리스크

리스크전형 시나리오영향 범위
파이프라인 정체 CI/CD 내 AI Review Agent 정지, PR이 자동 심사 대기 전원, 진행 중인 모든 PR
데이터 불일치 문서 일괄 업데이트 중도 실패로 일부만 신버전·일부 구버전 특정 모듈, 추적 어려움
조용한 품질 저하 약한 모델로 자동 강등, 출력은 계속되나 품질 부족, 리뷰에서야 발견 Agent 출력에 의존하는 하류 전부

공통점은 모니터링이 없으면 능동적으로 알리지 않는다는 것입니다. 팀의 첫 인지는 「오늘 Agent 출력이 왜 이상하지」「PR 큐가 왜 이렇게 쌓였지」이지 명확한 장애 알림이 아닙니다.

Runtime 환경의 역할

자주 놓치는 점: Agent는 모델 상태 변화를 계속 감지할 상시 가동 환경이 필요합니다. 개발자 MacBook에서 돌리면 새벽에 모델이 사라져도 머신은 슬립——프로세스도 모니터도 멈춥니다. 아침에 PC를 열면 실패가 이미 몇 시간 쌓여 있습니다.

Cloud Mac은 macOS를 상시 가동해 Agent가 다음을 실현합니다.

  • 24×7 온라인으로 모델 전환 즉시 감지·대응
  • Xcode·Instruments 등 macOS 네이티브 도구를 Apple Silicon 그대로 사용
  • 작업 컨텍스트·디스크 상태 유지, 모델 전환 후 환경 재구축 불필요
  • Launchd·프로세스 감시로 크래시 후 자동 재시작

6. Macstripe 관점: 단일 모델에 의존하지 않는 Agent 인프라

Fable 5 사건은 ‘단일 장애점’ 테스트였습니다. 모델·API 제공자·실행 환경 중 무엇이 사라져도 Agent 기반은 무너지면 안 됩니다. 영원히 안 사라질 모델을 찾는 게 아니라 변동에 견디는 아키텍처를 설계합니다.

권장: 3계층 분리

                    User / CI trigger
                          |
                          ↓
               Agent Orchestrator (Claude Code)
                          |
          ┌───────────────┼───────────────┐
          ↓               ↓               ↓
    Context Layer    Execution Layer   Model Layer
    (MCP + repo)     (Cloud Mac)       (OpenRouter)
                          |               |
                     macOS / Xcode   Claude Sonnet
                     Shell / Git     Claude Haiku
                     Launchd         Ollama (local backup)

원칙: Model Layer는 OpenRouter로 느슨하게, Execution Layer는 Cloud Mac으로 영속화. 어떤 모델이 목록에서 제거돼도 Orchestrator는 Model Layer 라우트만 바꾸면 되고 실행 환경 재구축은 필요 없습니다.

Model Layer: OpenRouter 설정 예

// .claude/settings.json (OpenRouter routing)
{
  "model": "openrouter/anthropic/claude-opus-4",
  "apiBaseUrl": "https://openrouter.ai/api/v1",
  "apiKey": "${OPENROUTER_API_KEY}",
  "modelFallback": {
    "enabled": true,
    "chain": [
      "openrouter/anthropic/claude-sonnet-4-5",
      "openrouter/anthropic/claude-haiku-4-5",
      "openrouter/meta-llama/llama-3.1-405b"
    ],
    "triggerOn": ["model_not_found", "overloaded", "rate_limit"]
  }
}

Execution Layer: Cloud Mac Launchd 설정

<!-- ~/Library/LaunchAgents/com.macstripe.agent-watchdog.plist -->
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE plist PUBLIC "-//Apple//DTD PLIST 1.0//EN"
  "http://www.apple.com/DTDs/PropertyList-1.0.dtd">
<plist version="1.0">
<dict>
  <key>Label</key>
  <string>com.macstripe.agent-watchdog</string>
  <key>ProgramArguments</key>
  <array>
    <string>/usr/local/bin/claude</string>
    <string>--config</string>
    <string>/Users/agent/.claude/settings.json</string>
    <string>--agent-mode</string>
  </array>
  <key>KeepAlive</key>
  <true/>
  <key>ThrottleInterval</key>
  <integer>30</integer>
</dict>
</plist>

팀 규모별 권장 구성

시나리오권장Model LayerRuntime
개인 개발 Claude Code + OpenRouter fallback Sonnet → Haiku Cloud Mac M4 16GB
5~15인 팀 Claude Code + MCP + OpenRouter Opus → Sonnet → Haiku Cloud Mac M4 24GB
저지연 중시 OpenRouter + Ollama 로컬 백업 클라우드 라우트 + 로컬 Qwen2.5-Coder Cloud Mac M4 Pro 48GB
24×7 크로스 타임존 Agent Cloud Mac 상시 + Launchd + 헬스체크 OpenRouter 멀티 프로바이더 Cloud Mac M4 Pro(전용)

하루 몇 번·수동 트리거의 경량 Agent는 OpenRouter fallback만으로 충분합니다. PR·Issue·모니터링 알림을 24×7 처리하려면 Launchd + Cloud Mac이 필수이고 로컬 MacBook은 대체가 안 됩니다.

맞지 않는 경우

  • 특정 모델(Fable 5 추론 스타일 등)에 강하게 묶여 fallback 후에도 반드시 사람 검수가 필요한 경우——아키텍처가 그 판단을 대신할 수 없습니다
  • 예산이 극도로 제한되고 Agent가 하루 1~2회면 M4 Mac Mini 요금 비교를 보면 로컬 수동 대응이 더 쌀 수 있습니다
  • OpenRouter는 지역에 따라 Anthropic 직호출보다 100~300ms 지연이 날 수 있어 지연 민감 워크플로는 검증 필요

자주 묻는 질문 FAQ

Fable 5는 무엇이고 왜 사라졌나요?

Fable 5(내부명 claude-fable-5)는 Anthropic Claude 5 계열 중 하나로 Cursor 등 모델 선택에 단기간 등장했습니다. 공식 상세 설명은 없으며 흔한 원인은 용량 통제(고연산으로 전 환경 안정 공급 곤란), 버전 관리(내부 테스트·그레이), API 스펙 변경, 임시 목록 제거입니다. AI 모델 개발 단계에서 흔하며 영구 폐기를 뜻하지 않습니다.

모델이 목록에서 제거돼 Agent가 멈췄습니다. 어떻게 하나요?

먼저 Agent 설정을 사용 가능한 모델(claude-sonnet-4-5, claude-opus-4 등)로 바꾸고 OpenRouter를 Model Router 계층으로 도입해 모델명 하드코딩 대신 규칙으로 능력을 호출하세요. fallback 설정 여부를 확인해 주 모델 불가 시 자동 강등으로 계속 돌게 하세요.

OpenRouter로 모델 불안정을 해결할 수 있나요?

대부분의 가용성 문제는 완화되지만 만능은 아닙니다. 통합 API로 여러 모델을 라우트하고 주 모델 불가 시 fallback 체인으로 자동 전환합니다. 다만 OpenRouter도 상류 API에 의존하므로 Anthropic이 모델을 전면 중단하면 동일하게 제공 불가입니다. 진짜 안정성에는 Model Router + 로컬 Ollama 백업 조합이 필요합니다.

Cloud Mac은 모델 전환에 어떻게 도움이 되나요?

Cloud Mac은 macOS를 상시 가동해 Agent 프로세스를 24×7 온라인으로 두고 모델 상태 변화를 감시합니다. Model Router가 주 모델 불가를 감지해 전환하면 Cloud Mac의 Agent는 수동 개입 없이 작업을 이어갑니다. 로컬 PC는 슬립·네트워크 끊김·종료로 전환 신호를 받지 못해 작업이 완전히 멈춥니다.

내 Agent에 단일 모델 의존 리스크가 있는지 어떻게 알 수 있나요?

다음 3가지를 확인하세요. 1) .claude/settings.json이나 .cursor/mcp.json에 특정 모델명이 하드코딩됐는지. 2) 워크플로 스크립트가 claude-fable-5 등 구체 버전을 직접 호출하는지. 3) fallback·retry 로직이 있는지. 하나라도 「하드코딩 있음·fallback 없음」이면 리스크입니다. 우선 OpenRouter 라우트 계층을 넣으세요.

정리

Fable 5 소실은 우연이 아니라 구조적 신호입니다. 2026년 모델 공개·목록 제거·버전 갱신 속도는 어느 엔지니어링 팀의 수동 대응보다 빠릅니다.AI Agent 인프라의 핵심 안정성 과제는 ‘모델이 좋은가’에서 ‘모델이 바뀌어도 시스템이 계속 도는가’로 옮겨갔습니다.

  • Fable 5는 단기 공개 후 소실——앞으로 12~18개월은 더 잦아질 뿐, 공급 불안정은 쉽게 나아지지 않음
  • 70% 넘는 팀 Agent 설정에 단일 모델 의존——지금 가장 흔한 취약점
  • OpenRouter fallback 체인은 최저 비용 1차 방어선, 5분이면 설정 가능
  • Cloud Mac 상시 Runtime은 2차 방어선——언제든 모델 변화를 감지·대응
  • 하루 1~2회 경량 Agent는 수동 전환도 허용; 24×7 자율 Agent에는 영속 Runtime 필수

다음 단계: 기존 Agent 설정을 10분 점검해 하드코딩된 모델명을 OpenRouter 라우트로 바꾸세요. 로컬 MacBook에서 상시 가동이 필요하면 Macstripe Cloud Mac AI Agent 운영안——슬립·네트워크 끊김으로 Agent를 멈추지 않는 7×24 온라인 M4 Mac——을 검토할 가치가 있습니다.

관련 글