6)
설정 흐름은 대략 이렇습니다.
- /model에서 Fable 5 선택
- reasoning effort 최대로 설정
- 서브에이전트 생성
- deep-reasoner: Opus
- default-worker: Sonnet
- task-worker: Haiku
- Codex CLI 설치 후 플러그인 추가
- CLAUDE.md에 오케스트레이션 규칙 작성
예시는 이런 식입니다.
“Fable은 오케스트레이터다.
직접 코드 수정하지 않는다.
중요한 결정과 작업 배분만 한다.
무거운 추론은 deep-reasoner가 맡고,
일반 작업은 default-worker가 맡고,
간단한 작업은 task-worker가 맡는다.
새 관점이 필요한 문제는 Codex와 함께 검토한다.”
강한 모델이 위에서 지휘하고,
실행 토큰은 아래 모델들이 씁니다.
제일 비싼 토큰을
코드 작성이 아니라 판단에만 쓰는 것.
7)
Fable의 컨텍스트를 가볍게 유지하라는 말도 그래서 중요합니다.
지휘자의 컨텍스트가 커지면
비싼 입력 토큰이 매 턴 반복해서 나갑니다.
이 구조에서 가장 비싼 지능은
코드를 한 줄도 짜지 않습니다.
누가 짤지 정할 뿐입니다.
정리하면 이렇습니다.
Fable은 고급 두뇌입니다.
Opus는 전두엽입니다.
Codex는 다른 계열의 전두엽입니다.
Sonnet은 메인 손발입니다.
Haiku는 잡무를 덜어주는 보조 손발입니다.
Codex 플러그인:
https://github.com/openai/codex-plugin-cc
오케스트레이터 (Orchestrator)
멀티 에이전트 시스템에서 전체 작업 흐름을 지휘하는 최상위 에이전트. 직접 실행하지 않고 하위 에이전트에게 작업을 분배·라우팅하며 결과를 통합한다. 출처
서브에이전트 (Sub-agent)
오케스트레이터의 지시를 받아 실제 작업(코드 작성, 검색 등)을 수행하는 하위 에이전트. 각자 별도의 모델과 도구를 사용하므로 단일 에이전트보다 토큰 소비가 많다. 출처
Reasoning Effort (추론 강도)
모델이 응답 생성 시 얼마나 깊이 추론할지를 조절하는 설정값(low / medium / high). 높을수록 더 많은 연산을 소비하지만 복잡한 문제에서 정확도가 올라간다. 출처
입력 토큰 (Input Tokens)
LLM 추론 시 모델에 전달되는 프롬프트(맥락 포함)를 구성하는 단위. 컨텍스트가 클수록 매 턴마다 소비되는 입력 토큰이 증가하며, 이는 비용과 직결된다. 출처
Codex CLI
OpenAI가 제공하는 터미널 기반 AI 코딩 에이전트. 에이전트 루프를 통해 사용자 지시·모델 추론·도구 실행을 조율하며, 플러그인으로 Claude Code 등 외부 시스템과 연동 가능하다. 출처
CLAUDE.md
Claude Code 프로젝트의 루트에 두는 설정 파일로, 오케스트레이션 규칙·역할 분담·행동 지침 등을 자연어로 기술한다. Claude가 세션 시작 시 이 파일을 읽어 동작 방식을 결정한다.