Prompt Engineering已死,Loop Engineering接棒,
@karpathy 的做法我感觉最有画面感,晚上设好研究循环,自动改脚本,跑测试,留对的,扔错的,自己去睡觉,早上起来直接看结果,全程几乎不插手。
这就是现在圈里聊的Loop Engineering,从指挥AI一步步走,变成设计一个能自己跑完的系统。
四个支柱,每一个都是生产环境踩出来的血泪坑。
1️⃣知道什么时候停,别信它自己说搞定了,代码跑不通,逻辑有漏洞的情况比比皆是,要加硬性退出条件和独立验证,无数项目从demo到落地就死在这一步。
2️⃣保持上下文干净,循环跑久了旧错误,死胡同,冗余思考堆在一起,决策质量直线下滑,要把上下文当有限预算管,定期压缩,用子Agent隔离子任务。
3️⃣给真正能用的工具,不是堆一百个凑数量,要少而精不重叠,可安全重试,错误信息能被看懂,这是生产环境最容易翻车的地方。
4️⃣有能说不的机制,Agent不会挑自己的毛病,自己改作业永远满分,必须把干活的和检查的分开,也就是Maker-Checker模式,Claude Code团队早就在用了。
@bcherny 说得最直白,我已经不prompt Claude了,我写loops,然后让它们跑。
模型正在慢慢变成标准件,
同一个模型,配上更好的循环设计,效果能从中等拉到顶级。
真正的工程价值,早就从单次对话转移到了长期自治系统的设计上。
做Agent的朋友可以对照着查一遍,什么时候你从写提示词的人,变成了设计系统的人,什么时候才算摸到了下一阶段的门槛。
Prompt Engineering의 시대가 끝나고 Loop Engineering이 등장했다. 이는 AI를 단순히 지시하는 것에서 시스템을 설계하여 자가 실행하게 만드는 방식으로 전환된 것을 의미한다.
Loop Engineering을 구축하기 위한 핵심 원칙은 다음과 같다.
이러한 시스템 설계가 되어야만 모델의 성능을 중등에서 최상급 수준으로 끌어올릴 수 있다.