在 pi 里同时跑多个模型,把各自的回答揉成一条,花更少的钱拿更好的结果。
https://github.com/leblancfg/pi-fusion
pi-fusion 是 pi 的一个扩展,给你的编码代理加了一道"并行扇出"流程。每次问问题之前,它会先派好几个工作模型同时去思考,最后把大家的思路汇总成一条完整的回复给你。
它还有个发现代理可以提前加载项目上下文,提示词也能自动重写。跑的时候终端里会实时分屏显示每个工作模型在干什么,按 Esc 就能取消退回普通模式。
预设可以保存,会话能存档恢复,提示词也能自己改。这套方案在多模型并行推理的研究上站得住脚,部分编码任务里确实比单用最强模型更快更省钱。