微软搞了个叫 SkillOpt 的东西,思路相当野:把 agent 的技能文档当成神经网络一样来训练,有 epoch、batch、学习率、验证集,但一根模型权重都不碰。
它厉害在哪?我给你拆三点:
1️⃣ 训练只改一份 skill 文档,新的改动必须在验证集上真涨分才收,不准瞎改
2️⃣ 部署时多花的模型调用,零,跑的还是你原来那个模型
3️⃣ 52 个测试格子全拿了第一或并列第一,GPT-5.5 上直接聊涨 23.5 分,Codex 涨 24.8,Claude Code 涨 19.1
最后产物就一个几百到两千 token 的小文件,能跨模型、跨工具直接搬。这玩意要真稳,手搓 prompt 的活儿是真要变天了。
GLM 4.7 Flash · Summary · 2h ago
- SkillOpt는 마이크로소프트가 개발한 기술로, 기존 모델의 가중치를 건드리지 않고 스킬 문서를 신경망처럼 학습시키는 방식입니다.
- 학습 과정에서는 epoch, batch, 학습률, 검증 세트 등의 개념을 적용하며, 검증 세트에서 점수가 오르지 않으면 변경 사항을 반영하지 않습니다.
- 배포 시 추가 모델 호출 비용은 없으며, 결과물은 수백~수천 토큰의 작은 파일로 생성됩니다.
- 테스트 결과, GPT-5.5는 23.5점, Codex는 24.8점, Claude Code는 19.1점씩 성능이 향상되었습니다.
- 이 기술은 모델과 도구에 상관없이 스킬 파일을 이식할 수 있어, 프롬프트 엔지니어링의 패러다임이 변화할 수 있습니다.