云计算百科
云计算领域专业知识百科平台

标签:transformer

PyTorch 实战:从 0 开始搭建 Transformer

文章浏览阅读994次,点赞20次,收藏8次。GCT 建议添加在 Conv 层前,一般可以先冻结原来的模型,来训练 GCT,然后解冻再进行微调。

阅读(38)

AI 大模型之 Transformer 架构深入剖析

文章浏览阅读1.6k次,点赞75次,收藏37次。在 Transformer 架构出现之前,循环神经网络(RNN)及其变体,如长短期记忆网络(LSTM)和门控循环...

阅读(59)