# 《DeepSeep RAG 知识库》 - 解析文档&Git仓库代码
作者:小傅哥
博客:https://bugstack.cn (opens new window)
课程:https://t.zsxq.com/GwNZp (opens new window)
沉淀、分享、成长,让自己和他人都能有所收获!😄
大家好,我是技术UP主小傅哥。
刚上周,老板说:”把咱们招聘里也加一条,具备AI应用开发能力的优先!“
。是呀,现在越来越多的企业都在用AI开发能力提效了,如;聊天软件增加一键唯独信息归档提取、工作文档资料携AI对话分析、工程SQL语句脚本辅运营自动完成数据处理、代码编写用AI完成自动评审等等。这些都是在AI的基础上在构建应用,以后也会越来越多!所以,具备AI应用开发能力,也是每个工程师最应该具备的基础能力了。

跟着小傅哥学习,从不走偏!😄
- 2022年底,ChatGPT 开始火爆。
- 2023年2月,小傅哥,开启了第一个基于AI的项目,ChatGPT AI 问答助手项目。让所有伙伴,都能学习到 AI 如何开发应用。
- 2023年4月,启动OpenAI(ChatGPT/ChatGLM)微服务应用体系构建大型项目,让大家可以用微信登录、微信支付/蓝兔支付,构建自己的可对外付费提供服务的 OpenAI。这一年上车学习的伙伴,很多做了自己的 AI 产品,除了提高编程技能,又小赚了一辆宝马。
- 2024年7月,结合企业诉求,开启 OpenAI + Github Acitons,实现代码自动化评审。这一年,不少伙伴在自己的公司中都有落地,个人也得到了述职晋升。
- 2025年3月,咱们再起启航,基于 Ollama 部署 DeepSeek,开发 RAG 知识库,解析文档和Git仓库代码。这个东西,将是企业中构建自己知识库的又一项非常重要的事情。有了知识库,AI 代码的自动评审,会更加精准,也可以辅助分析需求等。
那么,接下来小傅哥就细致的介绍下,本次开启的新项目,可以让大家学习到哪些知识,掌握哪些技术。
🧧文末提供了小傅哥所有实战项目的获取方式,一次加入全部可学!建议早早学习,让自己的年龄和能力相匹配。
# 一、能学到啥
该项目是结合当下最火的 Ollama、DeepSeek、SpringAI 等技术构建的 RAG 知识库实现。从前端到后端到 dev-ops 的全栈式功能手把手实现。
- 前端,基于 AI 工具,设计前端对话页面,完成 HTML、JS、TailwindCSS 的编码工作。
- 前端,配置跨域服务接口,前后端分离实现 UI + 服务端接口对接。
- 后端,构建双层架构,直接面向需求编码。让学习伙伴更轻松完成 RAG 知识库核心知识的学习。
- 后端,基于 Spring AI 完成 DeepSeek、OpenAI 双模型的策略对接,处理文本向量的解析和存储。
- 后端,使用 postgresql 存储切割文本向量数据,完成知识库的解析和存储。
- 后端,处理多样文本
(.md、.sql、.txt、.word...)
的解析储存以及Git克隆代码库遍历切割存储。 - 后端,使用 Redis 存储知识库标签,用于检索展示使用。
- 后端,基于 Flux 编写流式会话接口,以及增加知识库检索功能。
- 运维,基于 Docker 部署 Ollama 环境,完成 DeepSeek 大模型配置。
- 运维,使用 Linux、Docker、Nginx 完成项目的打包、构建、上线!
虽然,知识库都有很多现成的工具。但研发的能力不是在于功能应用,而是具备这样的开发技能储备,在有需要的时候,可以举手🙋🏻♀️”我会,我来做!“
此项目,全程视频手把手操作 + 全部的小册文档,你可以轻松上手学会这样一个项目!
# 二、项目介绍
这是一套基于 Ollama DeepSeek 大模型构建的增强 RAG 知识库检索项目,在这套项目上,实现了除普通文档知识解析外,增加了 Git 代码库的拉取和解析,并提供操作接口。为工程师做项目开发时,需求分析
、研发设计
、辅助编码
、代码评审
、风险评估
、上线检测
等,做工程交付提效。

# 1. 对话页面

- 这是全程视频手把手,带着大家通过AI工具,完成的UI设计实现课程会演示这个操作),实现的一款非常简单漂亮的UI效果。
- 我们可以结合知识库,进行更加有效的提问。像是公司中,会把知识库提供出一个标准接口,给其他各个AI应用平台提供能力。
# 2. 上传知识

- 上传知识,可以解析不同类型的知识库。
- 除了课程提供的文档库、代码库,你可以增加其他的知识库,如;网页的解析,与网页内容对话。让我们的UI,增加一个侧边栏,读取当前网页内容,分析对话。这样在公司中的一些工程的日志,错误分析时,可以更快的处理。
# 3. 解析知识 - 后台日志

- 上传知识后,可以看到日志信息。
- 一套工程作为知识库是非常具有开发价值的,在我们做提问的时候就不需要,人工的去分析工程,而是直接使用了。
# 4. 课程目录
- 第1节:AI RAG 知识库,项目介绍
- 第2节:初始化知识库工程&提交代码
- 第3接:Ollama DeepSeek 流式应答接口实现
- 第4节:Ollama DeepSeek 流式应答页面对接
- 第5节:Ollama RAG 知识库上传、解析和验证
- 第6节:Ollama RAG 知识库接口服务实现
- 第7节:基于AI工具,设计知识库UI和接口对接
- 第8节:Git仓库代码库解析到知识库
- 第9节:扩展OpenAI模型对接,以及完整AI对接
- 第10节:云服务器部署知识库(Docker、Nginx)
- 第11节:总结&扩展,AI 知识库还能迭代什么需求。
- 场景;解析网页地址,转换为知识库。网页地址可以深度检索。以及UI侧边栏分析网页。
- 业务;结合openai代码自动评审,会更加准确。
- 业务;结合 openai 业务项目,增加知识库使用。
- 技术;上传知识库,如果你的配置高,可以把解析上传过程设计为多线程
- 功能;知识库可以多项选择,从多个知识库提供只是。如,代码知识库库 + 业务文档知识库 + 库表知识库 + 研发设计知识库(多线程方式拉取这些知识库更快),最终提供新需求编码建议
- 功能;增加图片解析能力。
- 功能;对话时候,勾选内容,填充到某个知识库中。增强知识库能力。
# 5. 课程计划
课程已全部录制完成,计划在3月3日开更,3月16日之前全部剪辑更新完成。

- 全课程包括文档 + 小册,全程视频手把手带着做。
- 此项目,不耽误星球其他项目进度。拼团继续推进,马上开启三阶段分布式高并发场景设计实现。
- 课程地址:https://t.zsxq.com/GwNZp (opens new window)
课程包括;视频、小册、1 对 1 答疑解惑、专属VIP项目交流群,并且提供简历编写模板结构的一条龙🐲服务。让你学习后,直接拉开与还在玩具项目其他人的差距,面试脱颖而出提高竞争力!!!