AI 大模型之 Transformer 架构深入剖析
文章浏览阅读1.6k次,点赞75次,收藏37次。在 Transformer 架构出现之前,循环神经网络(RNN)及其变体,如长短期记忆网络(LSTM)和门控循环...
文章浏览阅读1.6k次,点赞75次,收藏37次。在 Transformer 架构出现之前,循环神经网络(RNN)及其变体,如长短期记忆网络(LSTM)和门控循环...
文章浏览阅读924次,点赞41次,收藏30次。《计算机名人堂》第九篇:马文·李·闵斯基
文章浏览阅读2.3w次,点赞92次,收藏116次。在机械电子工程产业中,人工智能的加持可用于故障诊断、生产流程优化、产品设计辅助等方面,比如通过分析设备数据预测...
文章浏览阅读1k次,点赞19次,收藏18次。(6)点击开机(我建议选择无卡开机,也就是点击更多,点击无卡开机),无卡开机意思就是此时你不占用GPU资源,容易出现...
文章浏览阅读958次,点赞9次,收藏8次。【代码】flask搭建微服务器并训练CNN水果识别模型应用于网页。_flask cnn
文章浏览阅读4.6k次,点赞156次,收藏85次。一边是模型能力引爆全网的核聚变反应,一边是算力资源在流量洪流中的苦苦支撑。今天,我经过实践验证了一条免费满血版...
文章浏览阅读1.2k次,点赞28次,收藏36次。英伟达4090D GPU服务器上部署 DeepSeek R1实战(提供项目代码、英伟达4090D显卡服务器完整环...
文章浏览阅读1.5k次,点赞24次,收藏9次。基于Java的智能家居设计:打造可扩展的智能家居中心服务器关键词智能家居系统Java编程中心服务器可扩展性设备接入...
文章浏览阅读2.9k次,点赞74次,收藏35次。本章详细介绍:【新手微调大模型】【全网最详细】在AutoDL租赁4090服务器,通过LLaMA-Factory框...
文章浏览阅读859次,点赞10次,收藏8次。1.打开hugging face 官网:https://huggingface.co/docs/transforme...