标签：transformer

六大AI模型组合方向结合好出论文：小波变换、多模态大模型、计算机视觉、transformer、CNN、LLM

文章浏览阅读588次，点赞20次，收藏19次。本文总结了人工智能领域六大创新模型组合方向及其研究价值：1. Transformer+CNN实现全局-局部特征互补...

2025-08-14阅读(232)

文章浏览阅读826次，点赞10次，收藏23次。本文介绍了参数高效微调(PEFT)技术及其在自然语言处理中的应用。文章首先探讨了如何选择适合的预训练模型，以文本风...

2025-08-13阅读(145)

文章浏览阅读196次，点赞8次，收藏8次。引言大模型应用架构是连接基础模型能力与实际业务场景的关键桥梁，它通过系统化的设计，将大模型的潜力转化为可落地的解决方案...

2025-08-12阅读(159)

文章浏览阅读125次。DCNv4更快收敛、更高速度、更高性能，完美和YOLOv13结合，助力涨点

2025-07-30阅读(169)

文章浏览阅读380次，点赞14次，收藏2次。引用格式：Hollmann N, Müller S, Eggensperger K, et al. Tabpfn: ...

2025-07-30阅读(286)

文章浏览阅读636次，点赞12次，收藏17次。本文介绍了Transformer模型中的编码器实现，重点讲解了编码器的核心组件及其作用。编码器由N个堆叠的编码器层...

2025-07-30阅读(111)

文章浏览阅读430次，点赞4次，收藏5次。本文提出了一种高效非局部注意力机制(ENLA)及其组成的Transformer模块(ENLTB)，用于解决图像处理中传...

2025-06-22阅读(147)

文章浏览阅读884次，点赞74次，收藏63次。Transformer基于自注意力和位置编码，采用编码器-解码器架构。编码器和解码器通过堆叠多头注意力层和前馈网络...

2025-05-16阅读(176)

文章浏览阅读994次，点赞20次，收藏8次。GCT 建议添加在 Conv 层前，一般可以先冻结原来的模型，来训练 GCT，然后解冻再进行微调。

2025-05-13阅读(149)

文章浏览阅读532次，点赞4次，收藏9次。Xinference需要配置驱动、torch、torch-npu等环境，最简单的方法是套用MindIE镜像。省略下载容...

2025-05-09阅读(1005)