试用
检索增强生成(RAG)是一种结合预训练参数和非参数记忆的文本生成技术。它使你能够通过你的领域内特有的包含上下文的知识,来强化预训练模型中的现有知识。使用 RAG,你会先从非参数记忆中去检索相关文档集(一般是通过在向量数据库中的相似性搜索),再使用LLM中的参数记忆生成与检索出的文档一致的输出。我们发现 RAG 对各种需要大量知识的 NLP 任务十分有用,包括问答,总结和故事生成。
QAnything 是一个问答界面的知识管理引擎,能够从包括 PDF、DOCX、PPTX、XLSX 和 MD 文件等在内的多种文件格式中总结和提取信息。出于数据安全考虑,QAnything 还支持离线安装。我们的一些团队使用 QAnything 来构建他们的团队知识库。在具有更深行业深度的 GenAI 场景中(例如为投资报告生成摘要),我们也尝试使用这个工具进行概念验证,以在构建真正的产品之前展示 LLMs 和 RAG 的潜力。
RAG & Friends
- GraphRAG: https://microsoft.github.io/graphrag/
References
- Retrieval Augmented Generation: Streamlining the creation of intelligent natural language processing models
- 什么是 RAG(检索增强生成)? https://aws.amazon.com/cn/what-is/retrieval-augmented-generation/
- 什么是检索增强生成 (RAG)?https://www.elastic.co/cn/what-is/retrieval-augmented-generation
- Build a Retrieval Augmented Generation (RAG) App: https://python.langchain.com/v0.2/docs/tutorials/rag/