【大模型评测】数据集一变,指标就失去可比性,我们应该怎么做?不是所有数据集更新,都可以直接对比模型指标。必须先判断:这次数据变动,是不是破坏了可比性? 一、判断是否...2026-02-04阅读(74)