# 엔트로픽이 sonnet 5를 공개했는데 백서에는 아래처럼 적혀있다. “몇 달 전까지만 해도 더 크고 비싼 모델이 필요했던 작업을, 이제 S...
Canonical: https://social-archive.org/yena/XBVqJeFGaO
Original URL: https://x.com/supernovajunn/status/2072104959404044782
Author: Cognac(꼬냑)
Platform: x
## Content
엔트로픽이 sonnet 5를 공개했는데 백서에는 아래처럼 적혀있다. “몇 달 전까지만 해도 더 크고 비싼 모델이 필요했던 작업을, 이제 Sonnet급 모델이 처리한다.” 엔트로픽 자료 기준으로 Sonnet 5는 SWE-bench Pro에서 63.2%, Terminal-Bench 2.1에서 80.4%, OSWorld-Verified에서 81.2%를 기록했다. Opus 4.8보다는 조금 낮거나 비슷하지만, Sonnet 4.6과 비교하면 꽤 큰 폭으로 올라왔다. 특히 GDPval-AA v2에서는 Sonnet 5가 1618점, Opus 4.8이 1615점이다. 이건 “가성비 모델이 생각보다 많이 올라왔다”는 뜻인 것 같다. 가격도 Sonnet 5는 8월 31일까지 입력 100만 토큰당 2달러, 출력 100만 토큰당 10달러로 시작하고, 이후에는 3달러/15달러로 시작하고. Opus 4.8이 5달러/25달러라는 점을 보면, 엔트로픽은 sonnet 5를 단순 보급형 모델이 아니라 실무 에이전트의 기본 엔진으로 밀고 있는 것 같다. 개인적으로 이번 발표에서 제일 크게 보이는 건 “Opus의 역할 변화”다. 예전에는 복잡한 에이전트 작업을 하려면 상위 모델을 써야 했다. 이제는 Sonnet이 대부분의 실행을 담당하고, Opus는 더 어려운 판단이나 고급 문제에 쓰이는 구조로 갈 가능성이 높다. 회사 직급으로 보면 Opus는 비싼 시니어 컨설턴트고, Sonnet 5는 매일 일하는 실무형 에이스라고 본다 기업이 진짜 많이 쓰는 건 결국 후자다.
