
一文深入了解DeepSeek-R1:模型架构
文章浏览阅读6.8k次,点赞42次,收藏76次。DeepSeek-R1 (DeepSeek-V3) 总共包含 671B 个参数,其中每个标记激活 37B 个。在...

文章浏览阅读6.8k次,点赞42次,收藏76次。DeepSeek-R1 (DeepSeek-V3) 总共包含 671B 个参数,其中每个标记激活 37B 个。在...

文章浏览阅读7k次,点赞26次,收藏73次。MoE在每次推理时选择性地激活部分模型参数,在不成比例增加计算成本的情况下,可以扩展模型参数。在DeepSeek-V...

文章浏览阅读2.3w次,点赞92次,收藏116次。在机械电子工程产业中,人工智能的加持可用于故障诊断、生产流程优化、产品设计辅助等方面,比如通过分析设备数据预测...

文章浏览阅读6.4k次,点赞88次,收藏85次。DeepSeek是由中国初创公司DeepSeek所开发的一款大型语言模型。该公司成立于2023年,并通过开源的方...

文章浏览阅读7k次,点赞100次,收藏67次。本文详细讲述深入研究复制文字与图片的混合内容到QQ、PC版微信以及企业微信中的剪切板数据对通遇到的多个问题以及解决...

文章浏览阅读1.2k次,点赞11次,收藏16次。今天,群里小伙伴在使用DeepSeek过程中,遇到最多的一个问题就是:“服务器繁忙,请稍后再试。”据说DeepS...

文章浏览阅读1.4k次,点赞25次,收藏19次。服务器通过异常端口提供服务可能存在安全风险(如挖矿、端口扫描等恶意行为),传统基于规则或签名的检测方法难以应对未...

文章浏览阅读1.9k次,点赞7次,收藏11次。如何在服务器上部署运行DeepSeek R1模型_服务器部署deepseek

文章浏览阅读739次,点赞16次,收藏21次。DeepSeek 作为国产开源大模型,近期因在线服务压力过大,本地部署需求激增。本教程将结合全网优质资源,手把手教...

文章浏览阅读5.9k次,点赞30次,收藏9次。最近大家使用 DeepSeek 时,是不是总被 “服务器繁忙,请稍后再试” 这句话困扰?首当其冲的就是 DeepS...