标签：transformer

第2页

Self-Attention原理和实现代码（Pytorch实现）

文章目录一、Self-Attention原理二、Self-Attention代码实现1.单头注意力单头注意力的代码实现2.多头注意力多头注意力的计算流程多头注意...

2026-01-25阅读(149)

引言：NLP领域的范式转移 2017年，谷歌的研究团队在论文《Attention is All You Need》中提出了一种全新的神经网络架构——Trans...

2026-01-24阅读(136)

前言：推开那扇通往“上帝视角”的门 🌪️ 一场静悄悄的革命把时针拨回 2017 年。那时候的 AI 还在费劲地像小学生一...

2026-01-23阅读(144)

LLM：代码撰写的提示词目录 LLM：代码撰写的提示词一、核心概念与设计原则核心设计思路二、代码案例（Python） 1. 项目结构（模块化体现） 2....

2026-01-21阅读(159)

第一步：准备数据 6种蝴蝶数据：self.class_indict [\"曙凤蝶\", \"麝凤蝶\", \"多姿麝凤蝶\", ...

2026-01-17阅读(150)

langgraph 1.0正式版本后，有三种部署的方式，先说结论：如果只是部署自己的langgraph服务使用独...

2026-01-14阅读(180)

接前置文章：从零构建大模型读书记录(一)——理解大语言模型从零构建大模型读书记录(二)——处理文本数据从零构建大模型记录(三)——从零...

2026-01-13阅读(133)

文章浏览阅读588次，点赞20次，收藏19次。本文总结了人工智能领域六大创新模型组合方向及其研究价值：1. Transformer+CNN实现全局-局部特征互补...

2025-08-14阅读(454)

文章浏览阅读826次，点赞10次，收藏23次。本文介绍了参数高效微调(PEFT)技术及其在自然语言处理中的应用。文章首先探讨了如何选择适合的预训练模型，以文本风...

2025-08-13阅读(395)

文章浏览阅读196次，点赞8次，收藏8次。引言大模型应用架构是连接基础模型能力与实际业务场景的关键桥梁，它通过系统化的设计，将大模型的潜力转化为可落地的解决方案...

2025-08-12阅读(477)