
一文深入了解DeepSeek-R1:模型架构
文章浏览阅读6.8k次,点赞42次,收藏76次。DeepSeek-R1 (DeepSeek-V3) 总共包含 671B 个参数,其中每个标记激活 37B 个。在...

文章浏览阅读6.8k次,点赞42次,收藏76次。DeepSeek-R1 (DeepSeek-V3) 总共包含 671B 个参数,其中每个标记激活 37B 个。在...

文章浏览阅读7k次,点赞26次,收藏73次。MoE在每次推理时选择性地激活部分模型参数,在不成比例增加计算成本的情况下,可以扩展模型参数。在DeepSeek-V...
文章浏览阅读726次,点赞8次,收藏9次。MCP,全称是 Model Context Protocol,是一种用于配置分发的 gRPC 协议,最初被 Istio...

文章浏览阅读1.9k次,点赞7次,收藏11次。如何在服务器上部署运行DeepSeek R1模型_服务器部署deepseek
文章浏览阅读1k次,点赞15次,收藏11次。Flask 是一个轻量级的 Python 微框架,适合快速开发小型应用或原型。它允许通过扩展添加额外的功能。_gun...

文章浏览阅读4k次。蒸馏版本本地化部署的意义在于,可以免费使用个人电脑算力进行逻辑推理。而且,蒸馏模型相对于教师模型,是一个体积缩小60% 到80%、推理速度提...

文章浏览阅读859次,点赞6次,收藏5次。进入AI算力主导的全新智能时代!

文章浏览阅读1.6k次,点赞25次,收藏25次。购买服务器并部署AI模型是一个系统化的过程,需要根据具体需求选择合适的硬件、软件和部署方案。本文整理了在部署搭建...

文章浏览阅读1.2k次,点赞26次,收藏28次。如果你只想简单的抛给 DeepSeek 一个问题,就想得到一个满意的答案的话,我估计它也不可能让你满意。就像其他...

文章浏览阅读1.2k次,点赞18次,收藏14次。从上个月20号DeepSeek推出R1推理模型以来,DeepSeek一直频繁刷圈,一方面是来自行内行外的各个用户...