클로드범 on threads

yena shared this post · May 15

앤트로픽에서 미토스 나와도 이제 codex는 못이길듯

사람들이 Codex vs Claude 뭐가 코드 더 잘 짜주냐만 비교하는데
이건 하나만 알고 둘은 모르는거야
코덱스는 이미 질수 없는 길을 나아가기 시작했어

앱서버 런타임을 보면 답이 보여
코딩 에이전트의 승패는 모델이 아니라 런타임이 가르거든

1/
지금 코딩 에이전트 시장 상황을 보면

Claude:

xAI Grok:

둘 다 사용을 제한하는 데 집중하고 있어

근데 같은 시기에 OpenAI Codex는 뭘 하고 있었냐면

2/
Codex는 런타임을 Rust로 갈아엎고 있었어

2025년 4월 오픈소스 시작 때는 TypeScript + Node.js였거든
지금? 코드베이스의 95.7%가 Rust야

왜 바꿨냐면:

640개 이상 릴리스 (하루에 하나꼴)
5,075+ 커밋, 400+ 기여자, 9,000+ 포크

이건 단순 리팩토링이 아니야
"코딩 에이전트 = 서비스 인프라"로의 패러다임 전환이야

출처: github.com/openai/codex/discussions/1174

2/
핵심은 App Server 아키텍처야

기존 코딩 에이전트는 전부 이런 구조였어:
사용자 → 터미널 → 에이전트 → API

Codex App Server는 이걸 뒤집었어:
워커가 컨테이너에 워크스페이스를 프로비저닝하고
App Server 바이너리를 컨테이너 안에서 띄우고
JSON-RPC over stdio (JSONL)로 장기 연결 유지

이게 뭘 의미하냐면:
에이전트가 더 이상 "터미널 도구"가 아니라
"헤드리스 서비스"로 돌아가는 거야

3/
그래서 뭐가 가능해지냐면:

이게 그냥 하나의 앱서버 안에서 돌아가는거야

4/
여기서 진짜 중요한 게 나와

서드파티 에이전트 하네스들이
Codex 앱서버 위에서 네이티브로 돌아가기 시작했어

즉 Codex는 자기만의 도구가 아니라
다른 에이전트들이 올라타는 "런타임 플랫폼"이 되고 있어

5/
이걸 경쟁 구도로 놓고 보면

Claude Code:

Grok Build:

Codex:

코드 품질? 모델 벤치마크?
그건 매 릴리스마다 바뀌어

안 바뀌는 건
어떤 런타임 위에 생태계가 쌓이느냐야

iOS가 이긴 건 앱이 좋아서가 아니라
앱스토어 생태계가 쌓였기 때문이야

6/
사람들이 "누가 코드 더 잘 짜주냐"에 집중하는 동안
Codex는 런타임 플랫폼을 깔고 있었어

모델은 교체 가능해
런타임 위의 생태계는 교체 불가능해

애플이 그걸 증명했지

오현석 클로드 지금 IPO 앞두고 눈시뻘개져서 50%더드릴게요 이러고있는게 ㅋㅋㅋ May 15