八彩云

最新活动 HOT
最新活动
八彩云最全的活动专区，覆盖新人特惠、免费试用、专场活动等，您可以快速了解目前所有特惠活动
查看全部活动

精选活动

企业新客专场NEW

云服务器首年50元

续费优惠专场HOT

云服务器低至4折

全站特惠专区HOT

云智产品全站特惠一网打尽，云服务器低至0.3折

CDN国内流量包低至1元HOT

新用户专享加100元得1TB

新手专享

新用户上云体验专区HOT

云服务器首月低至12元

云数据库MySQL低至10元NEW

企业新用户专享每日限量

开发者上云首选HOT

云服务器/建站/内容创作限时特惠

云推广大使限时招募中HOT

推荐新客下单返利最高8万元

新品发布

域名注册服务

百余款域名后缀随心选，买赠CDN新用户500G大礼包

域名委托购买服务重磅上线

委托八彩云购买您心仪的域名

商标服务新品发布

申报快至1分钟权益保障免费送

智能建站特惠

智能可视化建站及小程序开发平台，轻松打造七合一站点
推广大使推荐返现

推荐好友上云最高获8万现金，推广大使仅限个人实名认证用户参与
产品与服务
查看全部产品

精选推荐 HOT

弹性计算

数据库

网络与 CDN
×

云服务器 ECS

云虚拟主机 WEB

云数据库 MYSQL

内容分发 CDN

数字证书 SSL

域名注册

短信SMS

对象存储 COS

轻量应用服务器

裸金属云服务器

服务器托管

机柜租用

带宽出租

八彩云建站

八彩云邮箱

云主机

文本短信
热门产品

云服务器 热销爆款

安全稳定，高弹性的计算服务

虚拟主机 热销爆款

预装了常见网站开发语言的运行环境

SQL云数据库 HOT

完全兼容MySQL的云原生数据库

轻量应用服务器 HOT

开箱即用，轻量应用场景首选

SSL 证书 HOT

全方位的 HTTPS 安全评级管理、监控服务

域名注册

提升企业形象，从域名开始

应用防火墙 WAF

应对 Web 攻击、入侵、漏洞利用、挂马、篡改、后门、爬虫等网站

裸金属服务器 HOT

高性能、高可靠、高安全的云化物理服务器

机柜托管

提供的优质IDC机柜资源

其他产品推荐

IDC服务

服务器托管

裸金属物理机

机柜托管

带宽出租

网站服务

短信服务

智能建站

对象存储

网站备案

安全与管理

云监控

云防火墙

网站威胁扫描

云边协同

边缘智能服务平台 EISP

边缘智能云EIC

产品动态

11月产品动态

八彩云大模型

八彩云大模型重磅推出hunyuan-turbo版本，速度更快效果更优

热卖产品手册

新功能节能宝 PUE 优化

新功能 “阿尔法”智能算力模块

新功能商用密码资源池

新功能国产化专有云

新功能云海 - 高性能分布式存储

计算

云服务器 HOT

云虚拟主机WEB

轻量应用服务器

裸金属云服务器

服务器托管

容器服务

原生容器

容器镜像仓库

Kubernetes 集群

边缘计算

边缘物理计算服务

边缘可用区

关系型数据库

云数据库 MySQL HOT

云数据库 SQL Server

云数据库 PostgreSQL

云数据库 MariaDB

云数据库 Percona

数据库生态工具

数据传输 DTS HOT

数据库自治服务 SmartDBA

数据库备份 DBS

分布式数据库

分布式数据库 StarDB HOT

分布式数据库 TiDB HOT

分布式关系型数据库 DRDS

云数据库 JED

NoSQL 数据库

云数据库 MongoDB HOT

云缓存 Redis HOT

云缓存 Memcached

云数据库 InfluxDB

图数据库与图计算

云数据库 JDNoSQL

数据分析

分析型云数据库 ClickHouse HOT

数据仓库 JDW

云原生实时数仓 Starwift 公测中

域名与网站

域名注册 NEW

WHOIS查询

域名解析

域名续费

CDN 与边缘

内容分发网络 CDN

MCDN NEW

边缘可用区

云上网络

私有网络

负载均衡

弹性网卡

NAT 网关

弹性公网 IP

共享带宽包

SD-WAN
解决方案
解决方案
八彩云面向丰富的业务场景，提供整套行业和技术解决方案，助力千行百业打造数智供应链
查看全部解决方案

行业解决方案

通用解决方案
×

游戏解决方案

网站解决方案

电商解决方案

教育解决方案

金融解决方案

医疗解决方案

智慧传媒解决方案

网络安全解决方案

游戏解决方案

网站解决方案

电商解决方案
游戏解决方案

专注高性能、高性价比简单好用的云计算产品依托....

网站解决方案

提供安全的防护体系，内网级混合云架构，一站....

智慧传媒解决方案

面向国内各级媒体机构，致力于打造智能化、高安....

电商解决方案

为金融行业客户量身定制合规安全、低成本、高性....

教育解决方案

结合教育场景打造了丰富的产品，无论您是在线教....

网络安全解决方案

集成了业界领先的大禹DDoS防御能力和专业化的主机....

金融解决方案

为金融行业客户量身定制合规安全、低成本、高....

医疗解决方案

专注高性能、高性价比简单好用的云计算产品优....

智能供应链

物流供应链流程改造和效率的全面提升

大型制造业数据中台

全面加速企业智能制造进程

乡村数智化

以数智化技术为乡村振兴贡献科技力量

游戏解决方案

专注高性能、高性价比简单好用的云计算产品依托....

电商解决方案

为金融行业客户量身定制合规安全、低成本、高性....

金融解决方案

为金融行业客户量身定制合规安全、低成本、高....

智能供应链

物流供应链流程改造和效率的全面提升

大型制造业数据中台

全面加速企业智能制造进程

乡村数智化

以数智化技术为乡村振兴贡献科技力量
服务市场
服务市场
八彩云与众多优秀的第三方服务商合作，为您提供企业发展所需服务
前往服务市场

运维服务

数据迁移/数据恢复

提供网站数据、软件数据、各种运营数据打包迁移服务用

网站搬家服务

提供任何程序、任何网站的搬家迁移服务

网站各种接口申请服务

代申请各种网站接口，配置网站接口

网站各种报错异常排除服务

提供网站运营中出现的各种400、500等访问异常处理

服务器运行异常排查

服务器运行异常，服务器负载异常，服务器运行环境异常

企业应用产品

域名注册服务

提高智能终端应用的安全指数

SSL安全证书

保证用户和服务器间信息传输安全，企业必选

官网搭建服务

提交企业资料，一条龙为您提供官网搭建服务

商标注册服务

代注册商标，合法保护您的企业权益

安全

技术文档

获取所有产品使用文档
云上开发

免部署，打开浏览器随时随地进行云端编码
云上实践

带你轻松体验云产品能力，降低学习门槛
云上加油站

开发者专属云服务器0.3元/天起
合作与生态
合作伙伴
愿携手合作伙伴共生、共创、共赢，致力于降低供应链成本提升运营效率，成为值得产业信赖的合作生态伙伴
了解详情

伙伴计划

合作伙伴

提供常见使用问题快速解决通道

代理分销平台

分销八彩云产品，提供OEM销售平台

八彩云赞助公益计划

八彩云百个站点服务器资源，支持网络内容的健康持续发展。

推广奖励

推广奖励示

推广奖励推八彩云或邀新用户给予奖励

生态合作活动

宝塔Linux面板

Liunx工具箱
合作伙伴意见反馈

伙伴专属通道，期待您的反馈

推广大使邀新奖励

邀请新用户上云，最高可得8万月佣金
支持与服务
支持与服务
可以通过在线咨询、电话、工单等与我们取得联系，八彩云为您提供专业的服务支持，助力轻松上云。
查看技术文档

支持热线：400-660-1659 售前电话：400-660-1659 客服QQ：info@bacaiyun.com

帮助中心

技术文档

获取所有产品使用文档

入门指南

热门产品5分钟快速入门

支持计划

获取所有产品使用文档

基础服务

智能助手

提供常见使用问题快速解决通道

联系我们

热快速获取专属支持

技术工单

7 × 24 小时在线提供服务

建议反馈

产品及服务官方反馈渠道

自助服务

找回密码

自助找回登录密码

修改绑定手机

自助修改账号保护手机号码

实名认证

完成账号实名认证

账户充值

在线充值及设置余额预警

订单中心

查看移产品订购产品的订单信息

账号安全设置

自助修改账号安全设置
100倍故障赔偿

故障导致产品无法使用，提供时间赔偿

7天无理由退款

我们承诺7天无理由全额退款

7x24小时服务

7X14小时多渠道服务支持

VIP多对一服务

进一步提供更细致、更专业的服务
了解八彩云
关于我们
八彩云是八彩云面向政府机构、企业组织和个人开发者推出的基于云计算技术、采用互联网模式、提供基础资源、平台能力、软件应用等服务的业务。
关于八彩云

八彩云简介

八彩云简介

联系八彩云

荣誉资质

八彩云动态

行业新闻

八彩云声明

隐私保护

使用条款

服务协议

禁止声明
云上实践

带你轻松体验云产品能力，降低学习门槛

中国站

中国站

文档备案控制台

注册有礼

扫码查看公告

基于开源大模型的RAG知识库系统搭建完整教程

发布人：八彩云分类：AI大模型发布时间：2026-06-30 07:18

➔

RAG（检索增强生成）是将大模型与企业私有知识库结合的主流方案。通过检索相关文档片段再让模型生成回答，既保证了回答的时效性，又解决了大模型知识截止和幻觉问题。本文使用DeepSeek-R1和Qwen2.5-MAX作为基座模型讲解搭建流程。

▶一、系统架构概览

一个完整的RAG系统包含以下核心组件：

●文档加载器：支持PDF、Word、HTML、Markdown等多种格式
●文本分割器：将长文档切分为语义完整的片段
●向量嵌入模型：将文本转化为向量表示
●向量数据库：存储和检索向量，如Milvus、Qdrant、Chroma
●大语言模型：根据检索结果生成最终回答
●重排序器：对检索结果进行精细排序，提升准确率

▶二、环境搭建与依赖安装

code

pip install langchain langchain-community chromadb
pip install sentence-transformers  # 嵌入模型
pip install ollama                 # 本地推理

# 拉取嵌入模型
ollama pull nomic-embed-text

# 拉取DeepSeek-R1作为回答模型
ollama pull deepseek-r1:7b

▶三、核心代码实现

code

from langchain_community.embeddings import OllamaEmbeddings
from langchain_community.llms import Ollama
from langchain_community.vectorstores import Chroma
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.document_loaders import DirectoryLoader
from langchain.chains import RetrievalQA

# 1. 加载文档
loader = DirectoryLoader("./docs/", glob="**/*.md")
documents = loader.load()

# 2. 分割文档
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=200,
    separators=["

", "
", "。", "！", "？", " ", ""]
)
chunks = text_splitter.split_documents(documents)

# 3. 创建向量库
embeddings = OllamaEmbeddings(model="nomic-embed-text")
vectorstore = Chroma.from_documents(
    documents=chunks,
    embedding=embeddings,
    persist_directory="./chroma_db"
)

# 4. 创建RAG问答链
llm = Ollama(model="deepseek-r1:7b", temperature=0.3)
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=vectorstore.as_retriever(search_kwargs={"k": 4})
)

# 5. 提问
result = qa_chain.run("DeepSeek-R1支持哪些量化版本？")
print(result)

▶四、优化技巧

●混合检索：结合向量相似度搜索和关键词BM25搜索，提升召回率
●HyDE：先让模型根据问题生成假设文档，再用假设文档检索，提高语义匹配度
●多轮对话：保存历史对话记录，支持追问和上下文理解
●引用溯源：在回答中标注信息来源，便于验证答案准确性

▶五、生产环境部署建议

对于生产环境，建议使用Milvus或Qdrant作为向量数据库（替代Chroma），使用FastAPI搭建API服务，并配置缓存层提升响应速度。非结构化数据量超过100万条时，推荐使用Elasticsearch的向量检索功能。

2026-06-30

本文地址：

https://www.bacaiyun.com/help/detail/docs/175

上一篇：用 Python 实现 RAG：从文档加载到语义检索全流程下一篇： OpenAI GPT-5大模型技术架构与核心能力解析

八彩云申明：本文内容由互联网用户贡献，该文观点仅代表作者，本站不拥有所有权，不承担相关法律责任。如发现有侵权/违规的内容，请联系我们info@bacaiyun.com。

基于开源大模型的RAG知识库系统搭建完整教程

▶一、系统架构概览

▶二、环境搭建与依赖安装

▶三、核心代码实现

▶四、优化技巧

▶五、生产环境部署建议

热门文章

热门活动

热门标签查看详情

成为八彩云会员，享受出众的上云实践机会和周到的尊贵服务！

7天无理由退款

0元免费备案

VIP多对1服务

7x24小时服务

100倍故障赔偿

云产品

解决方案

技术支持

了解八彩云

管理控制中心

关注或联系我们

咨询热线：

八彩云大模型

基于开源大模型的RAG知识库系统搭建完整教程

▶一、系统架构概览

▶二、环境搭建与依赖安装

▶三、核心代码实现

▶四、优化技巧

▶五、生产环境部署建议

热门文章

热门活动

热门标签 查看详情

成为八彩云会员，享受出众的上云实践机会和周到的尊贵服务！

热门标签查看详情