Claude Code 제대로 쓰는 사람 거의 없습니다.
다들 FOMO 때문에 깔고 프롬프트만 치는데, 앤트로픽이 말한 핵심은 전혀 다릅니다.
진짜 차이는 "하네스" 구조에서 나고, 이걸 아는 순간 결과가 완전히 달라집니다.
실제 사례 정리했습니다🧵
1/ Anthropic Labs 팀의 Prithvi Rajasekaran이 2026년 3월 24일에 작성한 블로그 포스트 "장기 실행 애플리케이션 개발을 위한 하네스 설계"는 AI가 인간의 개입 없이 수 시간 동안 자율적으로 풀스택 애플리케이션을 개발하도록 만드는 최첨단 에이전트 엔지니어링 기법을 소개합니다.
저자는 적대적 생성 신경망(GAN)에서 영감을 얻어 '생성자(Generator)'와 '평가자(Evaluator)' 에이전트를 분리하는 구조를 도입함으로써, 프론트엔드 디자인의 주관적 품질과 백엔드 코드의 검증 가능한 정확성을 모두 비약적으로 끌어올렸습니다.
2/ AI에게 긴 코딩 작업을 통째로 맡길 때 주로 발생하는 치명적인 실패 원인은 두 가지입니다.
첫째는 대화창이 꽉 찼다고 느끼면 작업을 대충 마무리 지으려는 '문맥 불안(Context Anxiety)' 현상이며,
둘째는 자신이 짠 엉망인 코드나 디자인에도 무조건 훌륭하다고 칭찬하는 '자기 객관화 실패(Self-Evaluation Issue)'입니다.
특히 정답이 없는 디자인 영역에서 이 문제가 심각했는데, 저자는 작업을 하는 생성자 에이전트와 이를 깐깐하게 채점하는 평가자 에이전트를 분리함으로써 이 문제를 해결했습니다.
3/ 평가자 에이전트가 주관적인 아름다움을 객관적으로 채점할 수 있도록 네 가지 명확한 기준이 프롬프트에 주입되었습니다.
이 기준은 색상과 레이아웃의 일관성을 보는 디자인 품질, 뻔한 템플릿이나 AI 특유의 스타일을 배제하는 독창성, 여백 등 기본기를 보는 기술적 완성도, 그리고 직관적인 사용성을 뜻하는 기능성으로 구성됩니다.
특히 독창성에 높은 가중치를 부여하자, AI는 뻔한 디자인을 버리고 3D 공간을 활용한 미술관 웹사이트를 구축하는 등 파격적인 창의성을 발휘하기 시작했습니다.
4/ 이러한 평가자-생성자 루프를 전체 웹 개발(Full-stack)로 확장하기 위해 기획자, 생성자, 평가자로 구성된 3인조 AI 팀 시스템(Harness)이 구축되었습니다.
기획자는 사용자의 짧은 프롬프트를 상세한 제품 기획서로 확장하고, 생성자는 기획서를 바탕으로 코드를 작성하며, 평가자는 Playwright라는 자동화 도구를 사용해 직접 브라우저를 띄우고 버튼을 클릭해가며 버그를 찾고 채점합니다.
이 과정에서 생성자와 평가자는 코드를 짜기 전 이번 턴(Sprint)에 무엇을 만들고 어떻게 검증할지 미리 합의하는 '스프린트 계약(Sprint Contract)'을 맺어 개발이 기획 의도에서 벗어나지 않도록 방지합니다.
5/ 이 3인조 시스템의 위력은 압도적이었습니다.
Claude Opus 4.5에게 2D 레트로 게임 메이커를 만들게 했을 때, 단일 에이전트는 9달러를 쓰고 20분 만에 먹통인 앱을 내놓았지만, 전체 하네스를 가동하자 200달러와 6시간을 들여 스프라이트 애니메이션과 AI 자동 맵 생성 기능까지 갖춘 완벽하게 작동하는 게임 엔진을 만들어냈습니다.
이후 문맥 불안 증세가 사라진 더 똑똑한 모델인 Claude Opus 4.6이 도입되자, 저자는 작업 단위를 잘게 쪼개던 스프린트 구조를 과감히 없애고 평가자의 개입 횟수도 줄이는 등 하네스를 훨씬 가볍게 최적화했습니다.
6/ 최적화된 시스템을 통해 저자는 4시간 동안 약 124달러를 들여 웹 브라우저에서 멜로디와 믹서가 작동하는 디지털 작곡 프로그램(DAW)을 완성해 냈습니다.
비록 전문 프로그램 수준은 아니었지만, 이 실험은 AI 모델이 똑똑해질수록 기존의 복잡한 시스템은 단순해짐을 보여줍니다.
동시에 더 똑똑해진 AI를 활용해 이전에는 불가능했던 거대한 애플리케이션을 만들기 위해 '새로운 시스템 조합(Novel combination)'을 끊임없이 찾아내는 것이 앞으로 AI 엔지니어들의 영원한 과제가 될 것임을 시사합니다.
해당 내용까지 담은 가이드북입니다 :
더 공부해야겠어요
통제가 되지 않으면 진짜 어느방향으로 가는지도 모를정도네요 Mar 25