Amto on x

yena shared this post · 2h ago

Amto

微软搞了个叫 SkillOpt 的东西，思路相当野：把 agent 的技能文档当成神经网络一样来训练，有 epoch、batch、学习率、验证集，但一根模型权重都不碰。

它厉害在哪？我给你拆三点：

1️⃣ 训练只改一份 skill 文档，新的改动必须在验证集上真涨分才收，不准瞎改

2️⃣ 部署时多花的模型调用，零，跑的还是你原来那个模型

3️⃣ 52 个测试格子全拿了第一或并列第一，GPT-5.5 上直接聊涨 23.5 分，Codex 涨 24.8，Claude Code 涨 19.1

最后产物就一个几百到两千 token 的小文件，能跨模型、跨工具直接搬。这玩意要真稳，手搓 prompt 的活儿是真要变天了。

GLM 4.7 Flash · Summary · 2h ago

SkillOpt는 마이크로소프트가 개발한 기술로, 기존 모델의 가중치를 건드리지 않고 스킬 문서를 신경망처럼 학습시키는 방식입니다.
학습 과정에서는 epoch, batch, 학습률, 검증 세트 등의 개념을 적용하며, 검증 세트에서 점수가 오르지 않으면 변경 사항을 반영하지 않습니다.
배포 시 추가 모델 호출 비용은 없으며, 결과물은 수백~수천 토큰의 작은 파일로 생성됩니다.
테스트 결과, GPT-5.5는 23.5점, Codex는 24.8점, Claude Code는 19.1점씩 성능이 향상되었습니다.
이 기술은 모델과 도구에 상관없이 스킬 파일을 이식할 수 있어, 프롬프트 엔지니어링의 패러다임이 변화할 수 있습니다.