
详解如何复现LLaMA 4:从零开始利用Python构建
文章浏览阅读2.3k次,点赞79次,收藏63次。首先,我们以的开发人员身份来理解 LLaMA 4 架构,然后通过一个例子来看看它是如何通过架构处理的,以便更清晰...
文章浏览阅读2.3k次,点赞79次,收藏63次。首先,我们以的开发人员身份来理解 LLaMA 4 架构,然后通过一个例子来看看它是如何通过架构处理的,以便更清晰...
文章浏览阅读897次,点赞18次,收藏21次。下图很直观的展示了旋转变换的过程:旋转编码 RoPE 可以有效地保持位置信息的相对关系,_swigu layer
文章浏览阅读688次,点赞22次,收藏15次。新手小白参考csdn上其他博主完成,开始接到这个小任务连docker怎么用完全不知道,最开始是直接用官方ollam...
文章浏览阅读2.7k次,点赞22次,收藏26次。LoRA 提出在预训练模型的参数矩阵上添加低秩分解矩阵来近似每层的参数更新,从而减少适配下游任务所需要训练的参数...
文章浏览阅读964次,点赞16次,收藏20次。本地服务器部署开源大模型有一个前提,就是得有 GPU 显卡资源,在我下面的例子中我租用了 autodl 中的算力资...
文章浏览阅读1.9k次,点赞22次,收藏25次。LLaMA-Factory 是一个强大的大型语言模型微调框架:支持多种模型:涵盖 LLaMA、LLaVA、Mis...
文章浏览阅读2.9k次,点赞74次,收藏35次。本章详细介绍:【新手微调大模型】【全网最详细】在AutoDL租赁4090服务器,通过LLaMA-Factory框...
文章浏览阅读732次,点赞6次,收藏7次。本篇文章主要讲述如何在本地电脑安装部署国产大模型deepseek-r1,通过ollama方式轻松部署deepseek-...
文章浏览阅读878次,点赞7次,收藏29次。最近DeepSeek大火,很多人都想用DeepSeek,但是无奈经常提示服务器繁忙,那就试试将DeepSeek部署到...
文章浏览阅读1.2k次,点赞19次,收藏24次。对于家养服务器购买建议是, 不要直接买准系统, 只买原装的主板和电源就够了, 机箱和风扇自己DIV, 因为原装考...