RAG

May 2024

试用

检索增强生成（RAG）是一种结合预训练参数和非参数记忆的文本生成技术。它使你能够通过你的领域内特有的包含上下文的知识，来强化预训练模型中的现有知识。使用 RAG，你会先从非参数记忆中去检索相关文档集（一般是通过在向量数据库中的相似性搜索），再使用LLM中的参数记忆生成与检索出的文档一致的输出。我们发现 RAG 对各种需要大量知识的 NLP 任务十分有用，包括问答，总结和故事生成。

QAnything 是一个问答界面的知识管理引擎，能够从包括 PDF、DOCX、PPTX、XLSX 和 MD 文件等在内的多种文件格式中总结和提取信息。出于数据安全考虑，QAnything 还支持离线安装。我们的一些团队使用 QAnything 来构建他们的团队知识库。在具有更深行业深度的 GenAI 场景中（例如为投资报告生成摘要），我们也尝试使用这个工具进行概念验证，以在构建真正的产品之前展示 LLMs 和 RAG 的潜力。

RAG & Friends

GraphRAG: https://microsoft.github.io/graphrag/

References

Retrieval Augmented Generation: Streamlining the creation of intelligent natural language processing models
什么是 RAG（检索增强生成）？ https://aws.amazon.com/cn/what-is/retrieval-augmented-generation/
什么是检索增强生成 (RAG)？https://www.elastic.co/cn/what-is/retrieval-augmented-generation
Build a Retrieval Augmented Generation (RAG) App: https://python.langchain.com/v0.2/docs/tutorials/rag/