在 AMD GPU 上使用 vLLM 的 Triton 推理服务器文章浏览阅读1.9k次,点赞16次,收藏14次。在这篇博客中,我们展示了使用Triton推理服务器与vLLM后端部署和服务三个LLM。这些都由AMD GPU和R...2025-04-19阅读(24)