AI 大模型之 Transformer 架构深入剖析
文章浏览阅读1.6k次,点赞75次,收藏37次。在 Transformer 架构出现之前,循环神经网络(RNN)及其变体,如长短期记忆网络(LSTM)和门控循环...
文章浏览阅读1.6k次,点赞75次,收藏37次。在 Transformer 架构出现之前,循环神经网络(RNN)及其变体,如长短期记忆网络(LSTM)和门控循环...
文章浏览阅读1.1w次,点赞49次,收藏64次。本专栏提供详细的 YOLO11 教程,包括基础知识、源码解析、入门实践、算法改进和项目实战,适合发表YOLO11...
文章浏览阅读2.9k次,点赞25次,收藏21次。这是咱这个系列的第三个文章了。毕竟,这是我好几天摸索出的经验,能帮助各位在几个小时内领会,我觉得也算是我的功劳一...
文章浏览阅读967次,点赞24次,收藏14次。使用LLamaFactory微调大模型时,很多依赖的版本关系复杂,很容易出现版本冲突的问题,这里主要涉及到cuda...