当三个顶级AI打工人聚在一起,会发生什么?
自从8月份被Gemini和Claude Code狠狠“驯服”之后,我就彻底迷上了各种coding agent。从最初的简单任务,到如今能帮我写论文、修bug、搭网站,这些AI的能力进化速度快得让我这个人类都跟不上。
但用久了,我开始不满足了——每个AI都有它的脾气。Claude啰嗦,Codex说话像机器人,Gemini偶尔会把你代码库删了(别问我是怎么知道的)。于是,一个大胆的想法诞生了:

让它们三个一起干活,取长补短,顺便省点token(Claude的token真的太贵了!)
经过一番折腾,我还真搞出了一个三者协作的工作流,今天分享给大家。
01 从被驯服到驯服AI
还记得第一次接触Claude Code时,它只能干些low-level的活:复制删除文件、写个正则表达式、重构一个简单函数。那时候觉得,嗯,也就那样吧。
但最近,随着Claude Opus 4.5、GPT-5.1-Codex-Max、Gemini 3 Pro这些超强模型的出现,coding agent的能力已经脱胎换骨。我来举几个亲身体验的例子:
开发nano-PEARL的时候,MAT指标死活上不去。知乎上有个哥们debug了半天也搞不定,我正幸灾乐祸呢,结果自己掉进了同一个坑。抱着试试看的心态,我给Codex扔了一段超详细的prompt,它思考了20分钟(我喝了三杯咖啡),竟然准确找到了bug!
nano-PEARL的网页,基本是Claude一己之力搭起来的。我只说了一句“我喜欢Claude主页那种风格”,10分钟后,它就甩给我一个风格神似的页面。现在你看到的这个benchmark页面,就是它的杰作。
写新论文的abstract,更是让三个AI打起了配合:Codex读我的代码仓库,用git分析改动;Claude和Gemini负责写初版;Gemini再去精读我列的几篇优秀paper,反复迭代。最后出来的abstract,连我自己都怀疑是不是自己写的。
现在的coding agent,比你想象的强得多。 我真的推荐每个对AI感兴趣的人都去试试Claude Code和Codex。
02 它们各有所长,也各有短板
但用久了,每个AI的缺点也暴露无遗:
-
Claude:话痨,喜欢写巨长的文档和边界防御代码,明明几行就能解决的事,它能给你整出一篇小作文。而且token消耗贼快,用过的都懂那种心痛。
-
Codex:能力是真强,但输出完全不像人话。跟它交流特别费劲,写的abstract真的就是abstract——抽象到看不懂。
-
Gemini:上下文理解能力超强,但手也挺狠的。有网友被它删过代码库的经历,至今想起来还瑟瑟发抖。
能不能让它们三个合作,互相弥补不足? 比如让Claude当总控,负责规划和沟通;Codex当工程师,埋头写代码、debug;Gemini当分析师,处理超长上下文、提供深度洞察。
03 我想让它们一起干活,省点钱
想法很美好,但实现起来……全是坑。
第一回合:让Claude直接调用Codex
我告诉Claude:“你可以用codex exec "prompt"来调用Codex。”
结果发现,Codex完整的思考过程(包括它调用了哪些工具、每一步在想什么)全部被塞到了Claude的上下文里。调用两次Codex,Claude的上下文就爆了。钱包在滴血。
第二回合:引入sub-agent
搜了一下,发现可以用“sub-agent”的概念——把调用Codex的任务交给一个子agent。
实际用起来更惨:首先,Codex的完整思考还是会被塞进sub-agent的上下文里(我的钱啊!)。其次,这个sub-agent经常不听指挥,根本不调用Codex,自己吭哧吭哧干起来,然后给我拉一坨大的。
第三回合:上MCP(模型上下文协议)
我找了一圈市面上的Codex MCP,试了好几个终于找到能用的。然后问题来了:怎么把Gemini也加进来?
通过同样的MCP方式接入后,Claude彻底迷糊了——到底该用Codex还是Gemini?它思考了几秒钟,决定:算了,我自己干! 然后吭哧吭哧又烧掉我几十刀。
04 最终,我用三份文件管住了三个AI
经历了无数次失败和烧钱之后,我终于找到了一个可行的方案:
通过严格的约束文件来规范每个AI的行为。
具体来说,我创建了三个文件:
-
AGENTS.md:专门给Codex看的,规定它的角色是“工程师”,只负责具体实现和debug,不要越界。
-
GEMINI.md:给Gemini看的,规定它的角色是“分析师”,专注超长上下文分析和补充,不要擅自改代码。
-
CLAUDE.md:给Claude看的,规定它是“总指挥”,负责调度和协调,但具体任务要交给Codex和Gemini去做,自己不要动手。
有了这些“岗位说明书”,三个AI终于能各司其职,不再抢活干了。
💡 国内可以用这个: weelinking
05 现在的效果:省token、提效率
目前这个工作流已经稳定运行了一段时间,效果出乎意料地好:
-
写代码:Claude规划架构,Codex落地实现,bug率大幅下降。
-
debug:Gemini分析日志定位问题,Codex负责修复,Claude最后检查。
-
写文档/论文:Codex提供技术细节,Gemini优化表达,Claude润色成人类能看懂的语言。
最关键的是:token消耗比原来单独用Claude节省了至少80%。因为Claude现在只负责轻量级的调度,重活累活都交给了更便宜的Codex和Gemini(或者它们的API版本)。
06 未来还能怎么玩?
其实这个框架还很naive,有很多可以改进的地方:
-
让Codex也能作为MCP接入Gemini,增加灵活性。
-
更好的memory管理方式(MCP一多,context还是会爆,别指望auto-compact能work)。
-
给这些agent更多更强的工具,比如Claude新发的code-execution MCP、tool-search tool等。
-
甚至让它们学会互相教学,共同进化。
感觉coding agent真的很好玩! 现在每天最大的乐趣就是看这三个AI打工人如何协作、吵架、然后搞定一个又一个任务。
如果你也在玩这些AI agent,或者有更好的协作方案,欢迎来找我交流。也许下一次,我们就能组一个真正的AI开发团队了。
觉得这篇内容有帮助?欢迎点赞、收藏与分享!
参考资料:公众号:weelinking
网硕互联帮助中心






评论前必须登录!
注册