Skip to main content

Command Palette

Search for a command to run...

Ai+rag 课程学习笔记(一)

Updated
1 min read
H

A former Web2 Expert in the E-commerce and SAAS industry. Skilled in Software Engineering and Team building. Also, I am a Hacker and Fullstack Engnieer. Now I am focusing on Web3, DeSoc, to be a Builder for the future! More can be seen on my Github.

因为Cos72有AI相关的开发诉求,包括Agents模块和AI search等等。而之前和几个同学也沟通过,对于一个社区来说,或者普通个体来说,处理复杂的信息是最繁重的事情,如果有AI来帮忙,会更好。

因此购买了一个135节课(每个10分钟左右),计划每日5节课速度学习,当然,也会记录笔记到此。视频限于版权无法分享,但心得可以。

24 Nov

RAG是什么?(答案来自AI):一句话,使用(图)数据库来增强AI生成结果。

RAG(Retrieval-Augmented Generation)是一种基于检索的生成模型架构,主要用于自然语言生成任务。它由两个主要组件组成:

检索组件(Retriever):这个组件用于从大型知识库中快速检索相关的信息,以辅助生成模型产生高质量的输出。

生成组件(Generator):这个组件是一个预训练的生成模型,它利用检索到的相关信息来生成最终的输出文本。

RAG的工作流程如下:

用户输入一个查询或任务描述
检索组件根据用户输入快速检索相关的背景信息或知识
生成组件结合检索到的信息生成最终的输出
通过这种方式,RAG可以利用大规模知识库中的信息来增强生成模型的性能,提高输出的相关性和信息丰富性。这种架构在问答系统、对话系统、文本摘要等自然语言生成任务中表现出色。

总的来说,RAG是一种集检索和生成于一体的模型架构,可以显著提升生成模型在信息丰富性和相关性方面的表现。它是近年来自然语言处理领域的一项重要进展。

RAG模型核心过程

  1. 准确率代表了生产级别的产品而非demo

  2. 信息源头解析为文本:如何检测识别率?

  3. 文本Splitter的大小等参数,如何切割效果评估、反馈、调优?

  4. 如何选择Split后的chunks转向量的模型?如何评估向量转换模型效果好坏?(RAG和知识图谱)

  5. 向量数据库选择和性能优化

  6. Prompt转换为查询向量后,如何调优向量匹配算法来查询到准确结果?

  7. 查询结果的降噪和rerank处理

  8. 效果评估

复杂问题

可以分解为子问题,然后使用Agents来分别完成和汇总

今日学习了9节课

RAG概述:1-7

LangChain开头1-2,这个下个笔记说

More from this blog

让你的私钥随时更换,可以四处旅行

是的基于社交恢复和社区运行的TEE KMS,普通个体的私钥可以依赖多层安全机制:passkey+Email+社区KMS(硬件安全)+AA多签(可适配多种签名机制,增加抗量子签名模块)。听起来非常棒!是人类数字未来中需要的东西。下面是我的一个研究项目,进行中,有经验的大牛可以指点一下(嵌入式和硬件钱包开发、TEE、抗量子等等)。 STM32MP157F-DK2 Development Project STM32MP157F-DK2 开发项目 🇬🇧 Jump to English Vers...

Jan 25, 20263 min read

人性之光-以自由之名

以自由之名 v0.1.5 有点怪怪的标题,原谅理工男的简单和直接。 先分享一点感触和认知:某个角度看,人性是想象力、创造力和情感,是人类独有的特质。 人性是区别于AI和机器人,以及其他生命和造物的独有内核。人性是一种对自由的追求:发挥你的想象力、创造力,拥有自己的情感,是人存在的一种方式,这种方式,称为自由。 作为普通个体,想在人类社会拥有自由,除去国家和法律赋予的基础保障和基本权利之外,哈耶克有个观点是时间、空间和选择的范围,是自由的基础保障;而福柯则反向给出了规训的方式:时间空间和力量(并非...

Jan 25, 20261 min read

How to play with AI vibe coding?

我们要和 AI 沟通,要总结几个经验,供大家参考(血泪教学,迭代无数次): 三个重点 重设计、三层文档体系、渐进式开发。 第一点 最重要就是设计一定要占据你开发时间的一半以上,包括研究,包括和 AI 的交互讨论,包括提取一些专题,然后跟其他的 AI 交流生成深度的报告,包括自己阅读相关的报告和分析,以及一些范例的 repository。 第二点 要完整的文档体系,不管哪一种,都要跟随文档体系来去不断地迭代你的和 AI 交互的过程;我现在使用的是,嗯,三层的文档管理体系。第一层呢是backlog...

Aug 17, 20252 min read

It is Fun for me.

jFlow: from research to production 创新之路:最有趣的探索之路。 创新之路 Road of Exploration Research Input=Idea:描述你的 idea,进行严谨的论证过程,逻辑结构类似于缩小版本的 SCI 论文。通过分析论证,得出结论,是真正有价值创新。 output=Solution:定义你的产品,包括产品定位、目标用户、核心功能、商业模式,让团队、社区、早期投资者、用户、合作伙伴等,都快速了解你的产品的价值所在。 Devel...

Aug 12, 20251 min read

我的AI小助手:RAG 本地测试记录(updating...)

预期: 数据: 本地个人计划和隐私、正常论文相关的科研、业界跟踪和研究分析,三大类都存储在本地,不要流出个人电脑。 初步的7B模型(本人MiniMac的上限)进行大体分析。 可以使用外部deepseek和grok,claude等外部API,但沟通内容是隔离和脱敏的,最简单就是7B分析的结论,进行隐私脱敏(自行设定脱敏规则)和单独目录存储(独立知识库),这个动作是离线断网进行。 然后针对沟通外部的独立知识库,可以充分利用外部大模型能力。 个人计划是使用雷电连接mac book和mac m...

Mar 15, 20251 min read

jLab

69 posts

It is my Lab for curiosity!