云计算百科
云计算领域专业知识百科平台

标签:pytorch

第2页

PyTorch 实战:从 0 开始搭建 Transformer

文章浏览阅读994次,点赞20次,收藏8次。GCT 建议添加在 Conv 层前,一般可以先冻结原来的模型,来训练 GCT,然后解冻再进行微调。

阅读(70)