https://arxiv.org/abs/2605.27366

AgentがSkillを自分で作るようにする手法

新しい問題が来たら、まず既存Skillで解けるか確認して、解けなければskill_createツールで新Skillを自動生成してテストまで通してくれる

しかも人間がつくったSkillよりもベンチマーク精度が良かったらしい

MUSE-Autoskill: Self-Evolving Agents via Skill Creation, Memory,...