如何选择深度学习服务器的GPU
文章浏览阅读819次,点赞11次,收藏13次。其次,散热系统的噪音控制也是考虑的重点。首先,AMD的GPU在性能上与NVIDIA的产品相比,虽然在单精度浮点运算...
文章浏览阅读819次,点赞11次,收藏13次。其次,散热系统的噪音控制也是考虑的重点。首先,AMD的GPU在性能上与NVIDIA的产品相比,虽然在单精度浮点运算...
文章浏览阅读1.6k次,点赞75次,收藏37次。在 Transformer 架构出现之前,循环神经网络(RNN)及其变体,如长短期记忆网络(LSTM)和门控循环...

文章浏览阅读1.6w次,点赞174次,收藏177次。神经架构搜索(NAS)是指通过搜索算法自动设计神经网络架构,从而优化特定任务的性能。NAS的目标是在一个定义...

文章浏览阅读1.8k次,点赞65次,收藏76次。智慧云图的架构迭代本质上是“从资源聚合到智能涌现”的过程,其核心在于通过时空智能、大模型与开放生态的融合,构建可...
文章浏览阅读1.1k次,点赞22次,收藏22次。MobileNet 是一个为移动和嵌入式设备设计的轻量化卷积神经网络家族,从 v1(2017)到 v4(2024...

文章浏览阅读1.7w次。Retrieval-Augmented Generation(RAG)架构在大模型时代大放异彩,而其中的 Retrieval 模块往往被...

文章浏览阅读1.8w次,点赞37次,收藏48次。在人工智能飞速发展的当下,大语言模型不断推陈出新,Deepseek 以其卓越的性能和出色的表现,吸引了众多 AI...

文章浏览阅读2.4k次,点赞40次,收藏7次。阿里云百炼平台是一款一站式的大模型开发及应用构建平台,旨在帮助开发者和业务人员快速设计和构建大模型应用。用户可以通...

文章浏览阅读1.1k次,点赞47次,收藏42次。MoE Align & Sort技术通过优化专家分配与计算并行性,在医疗领域的多模态数据处理、推理加速和...

文章浏览阅读924次,点赞41次,收藏30次。《计算机名人堂》第九篇:马文·李·闵斯基