云计算百科
云计算领域专业知识百科平台

weelinking组了个AI梦之队:Claude当领导,Codex做苦力,Gemini当军师,结果省了80%的token,还写完了论文!

当三个顶级AI打工人聚在一起,会发生什么?

自从8月份被Gemini和Claude Code狠狠“驯服”之后,我就彻底迷上了各种coding agent。从最初的简单任务,到如今能帮我写论文、修bug、搭网站,这些AI的能力进化速度快得让我这个人类都跟不上。

但用久了,我开始不满足了——每个AI都有它的脾气。Claude啰嗦,Codex说话像机器人,Gemini偶尔会把你代码库删了(别问我是怎么知道的)。于是,一个大胆的想法诞生了:

让它们三个一起干活,取长补短,顺便省点token(Claude的token真的太贵了!)

经过一番折腾,我还真搞出了一个三者协作的工作流,今天分享给大家。

01 从被驯服到驯服AI

还记得第一次接触Claude Code时,它只能干些low-level的活:复制删除文件、写个正则表达式、重构一个简单函数。那时候觉得,嗯,也就那样吧。

但最近,随着Claude Opus 4.5、GPT-5.1-Codex-Max、Gemini 3 Pro这些超强模型的出现,coding agent的能力已经脱胎换骨。我来举几个亲身体验的例子:

开发nano-PEARL的时候,MAT指标死活上不去。知乎上有个哥们debug了半天也搞不定,我正幸灾乐祸呢,结果自己掉进了同一个坑。抱着试试看的心态,我给Codex扔了一段超详细的prompt,它思考了20分钟(我喝了三杯咖啡),竟然准确找到了bug!

nano-PEARL的网页,基本是Claude一己之力搭起来的。我只说了一句“我喜欢Claude主页那种风格”,10分钟后,它就甩给我一个风格神似的页面。现在你看到的这个benchmark页面,就是它的杰作。

写新论文的abstract,更是让三个AI打起了配合:Codex读我的代码仓库,用git分析改动;Claude和Gemini负责写初版;Gemini再去精读我列的几篇优秀paper,反复迭代。最后出来的abstract,连我自己都怀疑是不是自己写的。

现在的coding agent,比你想象的强得多。 我真的推荐每个对AI感兴趣的人都去试试Claude Code和Codex。

02 它们各有所长,也各有短板

但用久了,每个AI的缺点也暴露无遗:

  • Claude:话痨,喜欢写巨长的文档和边界防御代码,明明几行就能解决的事,它能给你整出一篇小作文。而且token消耗贼快,用过的都懂那种心痛。

  • Codex:能力是真强,但输出完全不像人话。跟它交流特别费劲,写的abstract真的就是abstract——抽象到看不懂。

  • Gemini:上下文理解能力超强,但手也挺狠的。有网友被它删过代码库的经历,至今想起来还瑟瑟发抖。

能不能让它们三个合作,互相弥补不足? 比如让Claude当总控,负责规划和沟通;Codex当工程师,埋头写代码、debug;Gemini当分析师,处理超长上下文、提供深度洞察。

03 我想让它们一起干活,省点钱

想法很美好,但实现起来……全是坑。

第一回合:让Claude直接调用Codex

我告诉Claude:“你可以用codex exec "prompt"来调用Codex。”

结果发现,Codex完整的思考过程(包括它调用了哪些工具、每一步在想什么)全部被塞到了Claude的上下文里。调用两次Codex,Claude的上下文就爆了。钱包在滴血。

第二回合:引入sub-agent

搜了一下,发现可以用“sub-agent”的概念——把调用Codex的任务交给一个子agent。

实际用起来更惨:首先,Codex的完整思考还是会被塞进sub-agent的上下文里(我的钱啊!)。其次,这个sub-agent经常不听指挥,根本不调用Codex,自己吭哧吭哧干起来,然后给我拉一坨大的。

第三回合:上MCP(模型上下文协议)

我找了一圈市面上的Codex MCP,试了好几个终于找到能用的。然后问题来了:怎么把Gemini也加进来?

通过同样的MCP方式接入后,Claude彻底迷糊了——到底该用Codex还是Gemini?它思考了几秒钟,决定:算了,我自己干! 然后吭哧吭哧又烧掉我几十刀。

04 最终,我用三份文件管住了三个AI

经历了无数次失败和烧钱之后,我终于找到了一个可行的方案:

通过严格的约束文件来规范每个AI的行为。

具体来说,我创建了三个文件:

  • AGENTS.md:专门给Codex看的,规定它的角色是“工程师”,只负责具体实现和debug,不要越界。

  • GEMINI.md:给Gemini看的,规定它的角色是“分析师”,专注超长上下文分析和补充,不要擅自改代码。

  • CLAUDE.md:给Claude看的,规定它是“总指挥”,负责调度和协调,但具体任务要交给Codex和Gemini去做,自己不要动手。

有了这些“岗位说明书”,三个AI终于能各司其职,不再抢活干了。

  • Claude 账号(Pro 或 Team)
  • 能访问 Claude.ai 的网络环境
  • 💡 国内可以用这个: weelinking

    05 现在的效果:省token、提效率

    目前这个工作流已经稳定运行了一段时间,效果出乎意料地好:

    • 写代码:Claude规划架构,Codex落地实现,bug率大幅下降。

    • debug:Gemini分析日志定位问题,Codex负责修复,Claude最后检查。

    • 写文档/论文:Codex提供技术细节,Gemini优化表达,Claude润色成人类能看懂的语言。

    最关键的是:token消耗比原来单独用Claude节省了至少80%。因为Claude现在只负责轻量级的调度,重活累活都交给了更便宜的Codex和Gemini(或者它们的API版本)。

    06 未来还能怎么玩?

    其实这个框架还很naive,有很多可以改进的地方:

    • 让Codex也能作为MCP接入Gemini,增加灵活性。

    • 更好的memory管理方式(MCP一多,context还是会爆,别指望auto-compact能work)。

    • 给这些agent更多更强的工具,比如Claude新发的code-execution MCP、tool-search tool等。

    • 甚至让它们学会互相教学,共同进化。

    感觉coding agent真的很好玩! 现在每天最大的乐趣就是看这三个AI打工人如何协作、吵架、然后搞定一个又一个任务。

    如果你也在玩这些AI agent,或者有更好的协作方案,欢迎来找我交流。也许下一次,我们就能组一个真正的AI开发团队了。

     觉得这篇内容有帮助?欢迎点赞、收藏与分享!​ 

    参考资料:公众号:weelinking 

    赞(0)
    未经允许不得转载:网硕互联帮助中心 » weelinking组了个AI梦之队:Claude当领导,Codex做苦力,Gemini当军师,结果省了80%的token,还写完了论文!
    分享到: 更多 (0)

    评论 抢沙发

    评论前必须登录!