
4卡4090服务器GraphRAG环境部署、加载ollama向量模型及向量知识图谱构建、加载vllm本地DeepSeek 32B推理模型无缝接入及API接口调用
文章浏览阅读1k次,点赞36次,收藏17次。本文介绍了在4卡4090服务器上部署GraphRAG环境的过程。硬件配置包括双路至强金牌6148处理器、128GB内...

文章浏览阅读1k次,点赞36次,收藏17次。本文介绍了在4卡4090服务器上部署GraphRAG环境的过程。硬件配置包括双路至强金牌6148处理器、128GB内...

文章浏览阅读451次,点赞9次,收藏10次。如何以自动化、灵活、直观且适用于任何指令或响应的方式对语言模型的响应进行评分,以提高语言模型的对齐能力?论文提出了一...
文章浏览阅读434次,点赞18次,收藏4次。它是一次思想的远征,旨在绘制一张关于下一代计算范式的最完整地图。我们不仅将审视“是什么”,更将深入探究“为什么”,并...
文章浏览阅读948次,点赞17次,收藏23次。语音识别模型为什么要从服务器搬到移动端?以及如何高效、精准地完成这次“搬家”?范围覆盖从服务器部署的痛点,到移动端...
文章浏览阅读37次。本文详细介绍了基于YOLOv8的自动驾驶行人检测预警模块的实现方案。该系统采用模块化设计,包含行人检测、距离估算、轨迹跟踪、风险评估和预警生...
文章浏览阅读607次,点赞19次,收藏10次。Dify作为低代码AI开发平台,其核心组件支撑了从简单对话到复杂自动化应用的构建。本文深入解析了Dify的五大核心...
文章浏览阅读1.2k次,点赞44次,收藏19次。本章将使用使用Gradio构建多种形式的MCP客户端与服务器。首先,使用FastMCP构建服务器,使用ChatB...
文章浏览阅读695次,点赞5次,收藏5次。摘要:本文以Qwen3 32B大模型和海光K100 AI算力卡为基础,提出AI算力需求的评估方法。通过分析单token...

文章浏览阅读1k次,点赞18次,收藏26次。Model Context Protocol(MCP)是一种开放标准,用于定义 AI 模型如何与外部工具和数据源进行...

文章浏览阅读187次。这个需要自己查看电脑的配置,我的是笔记本电脑低配的,所以选的是cpu引擎,打开katago,进入到相应的文件夹,找到default_gtp...