yena shared this post · 3h ago
AYi

Prompt Engineering已死,Loop Engineering接棒,

@karpathy 的做法我感觉最有画面感,晚上设好研究循环,自动改脚本,跑测试,留对的,扔错的,自己去睡觉,早上起来直接看结果,全程几乎不插手。

这就是现在圈里聊的Loop Engineering,从指挥AI一步步走,变成设计一个能自己跑完的系统。

四个支柱,每一个都是生产环境踩出来的血泪坑。

1️⃣知道什么时候停,别信它自己说搞定了,代码跑不通,逻辑有漏洞的情况比比皆是,要加硬性退出条件和独立验证,无数项目从demo到落地就死在这一步。

2️⃣保持上下文干净,循环跑久了旧错误,死胡同,冗余思考堆在一起,决策质量直线下滑,要把上下文当有限预算管,定期压缩,用子Agent隔离子任务。

3️⃣给真正能用的工具,不是堆一百个凑数量,要少而精不重叠,可安全重试,错误信息能被看懂,这是生产环境最容易翻车的地方。

4️⃣有能说不的机制,Agent不会挑自己的毛病,自己改作业永远满分,必须把干活的和检查的分开,也就是Maker-Checker模式,Claude Code团队早就在用了。

@bcherny 说得最直白,我已经不prompt Claude了,我写loops,然后让它们跑。

模型正在慢慢变成标准件,

同一个模型,配上更好的循环设计,效果能从中等拉到顶级。

真正的工程价值,早就从单次对话转移到了长期自治系统的设计上。

做Agent的朋友可以对照着查一遍,什么时候你从写提示词的人,变成了设计系统的人,什么时候才算摸到了下一阶段的门槛。

GLM 4.7 Flash · Summary · 3h ago

Prompt Engineering의 시대가 끝나고 Loop Engineering이 등장했다. 이는 AI를 단순히 지시하는 것에서 시스템을 설계하여 자가 실행하게 만드는 방식으로 전환된 것을 의미한다.

Loop Engineering을 구축하기 위한 핵심 원칙은 다음과 같다.

  • 명확한 종료 조건: AI가 자신이 완료했다고 말해도 신뢰하지 말고, 코드 실행 여부와 논리적 검증을 통해 강제로 종료해야 한다.
  • 컨텍스트 관리: 오래된 에러와 불필요한 정보가 쌓이지 않도록 주기적으로 압축하고, 작업을 분리해야 한다.
  • 도구의 최적화: 불필요한 도구를 배제하고, 안전하게 재시도할 수 있고 오류를 이해할 수 있는 정밀한 도구만을 제공한다.
  • 검증 분리: Maker-Checker(Maker와 Checker 분리) 모델을 도입하여 AI가 자신의 작업을 검증하지 못하도록 막아야 한다.

이러한 시스템 설계가 되어야만 모델의 성능을 중등에서 최상급 수준으로 끌어올릴 수 있다.

92