
开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B-LoRA微调-LLaMA-Factory-单机单卡-V100(一)
文章浏览阅读1.4w次,点赞91次,收藏118次。使用LLaMA-Factory高效微调qwen2.5-7b-instruct_llama factory微调 ...
文章浏览阅读1.4w次,点赞91次,收藏118次。使用LLaMA-Factory高效微调qwen2.5-7b-instruct_llama factory微调 ...
文章浏览阅读897次,点赞18次,收藏21次。下图很直观的展示了旋转变换的过程:旋转编码 RoPE 可以有效地保持位置信息的相对关系,_swigu layer
文章浏览阅读484次,点赞4次,收藏3次。Qt创建一个模拟问答系统,目前的 getAIResponse 函数使用了一个简单的关键词匹配系统来模拟AI响应
文章浏览阅读1.2k次,点赞7次,收藏22次。首先,在InternStudio平台上创建开发机。创建成功后点击进入开发机打开WebIDE。进入后在WebIDE的...
文章浏览阅读715次,点赞12次,收藏17次。基于日志、错误告警、服务器状态等场景化的 “根因” 分析的进化_日志文件进行根因分析
文章浏览阅读4.6k次,点赞156次,收藏85次。一边是模型能力引爆全网的核聚变反应,一边是算力资源在流量洪流中的苦苦支撑。今天,我经过实践验证了一条免费满血版...
文章浏览阅读1.1k次,点赞9次,收藏20次。DeepSeek R1 联网对话功能确实很强大,不过总是会遇到"服务器繁忙,请稍后再试"的提示...
文章浏览阅读1.5k次,点赞20次,收藏21次。docker部署deepseek+anythinyLLM_乌班图 部署ollama
文章浏览阅读1.9k次,点赞46次,收藏35次。随着DeepSeek最近的爆火,其用户量已经呈指数级增长,在使用网页版时,经常会出现"服务器繁忙&qu...
文章浏览阅读2.2w次,点赞30次,收藏28次。近期爆火的Deepseek访问量激增频繁出现服务器繁忙提示,严重影响工作效率。本人实测了两种有效解决方案,整理了...