# 앤쓰로픽이 하네스 엔지니어링 아티클을 공유했어요. 특히 코드 품질 관련 내용이 많은데요! 함께 공부해보시죠. !Image 1 📌 서론 앤...
Canonical: https://social-archive.org/babyz79/pGcIGuaQAr
Original URL: https://www.threads.com/@vibematfia/post/DWTgvX-EtMn
Author: 바이브마피아 | Vibe마피아
Platform: threads
## Content
앤쓰로픽이 *하네스 엔지니어링 아티클*을 공유했어요. 특히 코드 품질 관련 내용이 많은데요! 함께 공부해보시죠. ![Image 1](https://social-archiver-api.social-archive.org/media/archives/babyz79/yxH8JPuysD/media/0.jpg) --- 📌 서론 - 앤쓰로픽은 코드 품질을 위해 다양한 시도를 해왔어요. - 결과적으로 frontend-design 스킬, 멀티 에이전트 같은 접근이 있었죠. - 하지만 모두 한계가 있어 새로운 시도가 필요했어요. --- 📌 한계 1: 결국은 컨텍스트가 문제 컨텍스트가 거의 꽉 찰때쯤 되면, 일관성이 크게 하락해요. 또 작업을 얼렁뚱땅 끝내버리는 경우도 있었다고해요. 이를 회피하기위해 작업경과를 문서화한 뒤, 적절한 타이밍에 컨텍스트를 reset하는 기법이 효과적이었대요. 작업결과를 기록해두고, 다른 세션이 이어받게 하는거죠. planner/generator/evaluator 3개 에이전트를 활용했어요. 설계, 구현, 검증의 책임을 분리한거에요. orchestrate하기 어렵고 단일세션보다 비용/시간 모두 더 들지만, 큰 문제를 해결하기 위해선 어쩔 수 없었다고해요. ![Image 2](https://social-archiver-api.social-archive.org/media/archives/babyz79/yxH8JPuysD/media/1.jpg) --- 📌 한계 2: 자가 피드백이 불가능 에이전트는 자신의 결과물을 긍정적으로 평가하는 경향이 있다고해요. 되게 사람이랑 비슷한 것 같네요 😅 이를 회피하기위해, 평가하는 에이전트를 따로 두는 것이 유효한 전략이에요. 평가자가 피드백을 주면 그걸 바탕으로 생성자가 결과물을 자가개선하는거죠. 이 과정을 여러번 반복했더니 유의미한 품질 상승이 있었다고 합니다. --- 📌 레슨런 1: 구체적 원칙을 제공하라. 좋은 평가를 위해선 반드시 구체적인 기준이 있어야해요. “아름다운 디자인” 같이 주관적인 판단이 들어가는 것 말고, “우리 디자인시스템을 명확히 따르는가?”처럼 객관적이고, 누구나 검증할 수 있어야해요. 좋은 기준을 만드는데는 필연적으로 시행착오를 겪어야해요. 앤쓰로픽도 QA에이전트가 초기에는 엉망으로 작동해서, 여러번 반복하며 지침을 개선해서 좀 쓸만하게 만들었다고해요. 내 취향을 잘 반영하는 결과물이 나올 수 있도록, 프롬프트를 튜닝하는건 예나 지금이나 중요한 일인 것 같아요. --- 📌 레슨런 2: 여러번 반복하라. 피드백 과정을 여러번 반복하다보면, 단순히 퀄리티를 조금 높이는 수준이 아닌 아예 창의적인 솔루션을 주기도 했다고해요. 첨부된 영상은 박물관 홈페이지 디자인을 반복개선한 결과인데, 처음엔 전형적인 웹사이트로 만들었다가 10회쯤 반복하니 공간자체를 재현해서 마치 실제로 박물관에 있는듯한 디자인으로 업그레이드 되었대요. 이런 창의적인 UX는 사람만의 영역이라고 생각했는데, 에이전트 협업구조를 잘 설계한 것만으로도 이런걸 할 수 있다는게 놀랍습니다. --- 📌 교훈 전반적으로 매우 특별한 케이스를 소개하진 않았지만, 에이전트 워크플로우의 필요성/작동방식을 이해하기 훌륭한 글이에요. 사실 전 컨텍스트 엔지니어링이랑 하네스 엔지니어링이 뭐가 다른지 잘 모르겠긴해요. 😅 결국 에이전트를 잘 쓰기위해선 다음 2가지가 중요한 것 같아요. 1. 내가 원하는 바를 *정확히* 설명하는 것 2. 적절한 단위로 작업을 쪼개주는 것 아직 하네스를 써보지 않은 분이라면, 이 글의 방법을 따라해보셔도 좋겠습니다. ㅎㅎ 읽어주셔서 감사합니다. 🙇 --- 원문 링크: https://www.anthropic.com/engineering/harness-design-long-running-apps
