weelinking组了个AI梦之队：Claude当领导，Codex做苦力，Gemini当军师，结果省了80%的token，还写完了论文！

当三个顶级AI打工人聚在一起，会发生什么？

自从8月份被Gemini和Claude Code狠狠“驯服”之后，我就彻底迷上了各种coding agent。从最初的简单任务，到如今能帮我写论文、修bug、搭网站，这些AI的能力进化速度快得让我这个人类都跟不上。

但用久了，我开始不满足了——每个AI都有它的脾气。Claude啰嗦，Codex说话像机器人，Gemini偶尔会把你代码库删了（别问我是怎么知道的）。于是，一个大胆的想法诞生了：

让它们三个一起干活，取长补短，顺便省点token（Claude的token真的太贵了！）

经过一番折腾，我还真搞出了一个三者协作的工作流，今天分享给大家。

01 从被驯服到驯服AI

还记得第一次接触Claude Code时，它只能干些low-level的活：复制删除文件、写个正则表达式、重构一个简单函数。那时候觉得，嗯，也就那样吧。

但最近，随着Claude Opus 4.5、GPT-5.1-Codex-Max、Gemini 3 Pro这些超强模型的出现，coding agent的能力已经脱胎换骨。我来举几个亲身体验的例子：

开发nano-PEARL的时候，MAT指标死活上不去。知乎上有个哥们debug了半天也搞不定，我正幸灾乐祸呢，结果自己掉进了同一个坑。抱着试试看的心态，我给Codex扔了一段超详细的prompt，它思考了20分钟（我喝了三杯咖啡），竟然准确找到了bug！

nano-PEARL的网页，基本是Claude一己之力搭起来的。我只说了一句“我喜欢Claude主页那种风格”，10分钟后，它就甩给我一个风格神似的页面。现在你看到的这个benchmark页面，就是它的杰作。

写新论文的abstract，更是让三个AI打起了配合：Codex读我的代码仓库，用git分析改动；Claude和Gemini负责写初版；Gemini再去精读我列的几篇优秀paper，反复迭代。最后出来的abstract，连我自己都怀疑是不是自己写的。

现在的coding agent，比你想象的强得多。我真的推荐每个对AI感兴趣的人都去试试Claude Code和Codex。

02 它们各有所长，也各有短板

但用久了，每个AI的缺点也暴露无遗：

Claude：话痨，喜欢写巨长的文档和边界防御代码，明明几行就能解决的事，它能给你整出一篇小作文。而且token消耗贼快，用过的都懂那种心痛。
Codex：能力是真强，但输出完全不像人话。跟它交流特别费劲，写的abstract真的就是abstract——抽象到看不懂。
Gemini：上下文理解能力超强，但手也挺狠的。有网友被它删过代码库的经历，至今想起来还瑟瑟发抖。

能不能让它们三个合作，互相弥补不足？比如让Claude当总控，负责规划和沟通；Codex当工程师，埋头写代码、debug；Gemini当分析师，处理超长上下文、提供深度洞察。

03 我想让它们一起干活，省点钱

想法很美好，但实现起来……全是坑。

第一回合：让Claude直接调用Codex

我告诉Claude：“你可以用codex exec "prompt"来调用Codex。”

结果发现，Codex完整的思考过程（包括它调用了哪些工具、每一步在想什么）全部被塞到了Claude的上下文里。调用两次Codex，Claude的上下文就爆了。钱包在滴血。

第二回合：引入sub-agent

搜了一下，发现可以用“sub-agent”的概念——把调用Codex的任务交给一个子agent。

实际用起来更惨：首先，Codex的完整思考还是会被塞进sub-agent的上下文里（我的钱啊！）。其次，这个sub-agent经常不听指挥，根本不调用Codex，自己吭哧吭哧干起来，然后给我拉一坨大的。

第三回合：上MCP（模型上下文协议）

我找了一圈市面上的Codex MCP，试了好几个终于找到能用的。然后问题来了：怎么把Gemini也加进来？

通过同样的MCP方式接入后，Claude彻底迷糊了——到底该用Codex还是Gemini？它思考了几秒钟，决定：算了，我自己干！然后吭哧吭哧又烧掉我几十刀。

04 最终，我用三份文件管住了三个AI

经历了无数次失败和烧钱之后，我终于找到了一个可行的方案：

通过严格的约束文件来规范每个AI的行为。

具体来说，我创建了三个文件：

AGENTS.md：专门给Codex看的，规定它的角色是“工程师”，只负责具体实现和debug，不要越界。
GEMINI.md：给Gemini看的，规定它的角色是“分析师”，专注超长上下文分析和补充，不要擅自改代码。
CLAUDE.md：给Claude看的，规定它是“总指挥”，负责调度和协调，但具体任务要交给Codex和Gemini去做，自己不要动手。

有了这些“岗位说明书”，三个AI终于能各司其职，不再抢活干了。

Claude 账号（Pro 或 Team）

能访问 Claude.ai 的网络环境

💡 国内可以用这个： weelinking

05 现在的效果：省token、提效率

目前这个工作流已经稳定运行了一段时间，效果出乎意料地好：

写代码：Claude规划架构，Codex落地实现，bug率大幅下降。
debug：Gemini分析日志定位问题，Codex负责修复，Claude最后检查。
写文档/论文：Codex提供技术细节，Gemini优化表达，Claude润色成人类能看懂的语言。

最关键的是：token消耗比原来单独用Claude节省了至少80%。因为Claude现在只负责轻量级的调度，重活累活都交给了更便宜的Codex和Gemini（或者它们的API版本）。

06 未来还能怎么玩？

其实这个框架还很naive，有很多可以改进的地方：

让Codex也能作为MCP接入Gemini，增加灵活性。
更好的memory管理方式（MCP一多，context还是会爆，别指望auto-compact能work）。
给这些agent更多更强的工具，比如Claude新发的code-execution MCP、tool-search tool等。
甚至让它们学会互相教学，共同进化。

感觉coding agent真的很好玩！现在每天最大的乐趣就是看这三个AI打工人如何协作、吵架、然后搞定一个又一个任务。

如果你也在玩这些AI agent，或者有更好的协作方案，欢迎来找我交流。也许下一次，我们就能组一个真正的AI开发团队了。

觉得这篇内容有帮助？欢迎点赞、收藏与分享！

参考资料：公众号:weelinking

weelinking组了个AI梦之队：Claude当领导，Codex做苦力，Gemini当军师，结果省了80%的token，还写完了论文！

01 从被驯服到驯服AI

02 它们各有所长，也各有短板

03 我想让它们一起干活，省点钱

04 最终，我用三份文件管住了三个AI

05 现在的效果：省token、提效率

06 未来还能怎么玩？

相关推荐

评论抢沙发

评论前必须登录！

热门标签

置顶推荐

热门文章

最新文章

01 从被驯服到驯服AI

02 它们各有所长，也各有短板

03 我想让它们一起干活，省点钱

04 最终，我用三份文件管住了三个AI

05 现在的效果：省token、提效率

06 未来还能怎么玩？

相关推荐

评论 抢沙发

评论前必须登录！

热门标签

置顶推荐

热门文章

最新文章

评论抢沙发