-
离线流程:
-
用户通过前端上传知识文件到S3
-
S3文件达到触发Lambda
-
Lambda启动Glue任务
-
Glue切分文档,调用向量化接口
-
将向量化结果写入OpenSearch
-
-
在线流程:
-
用户在前端发出请求
-
Lambda根据用户输入进行多路召回(语义向量召回、倒排索引召回等)
-
将召回结果整合到Prompt,提供给大型语言模型(LLM)
-
LLM结果反馈给用户
-
- OpenSearch主要检索知识文档,提供向量检索和倒排检索的能力。
- SageMaker主要用于部署和host大语言模型和向量模型。
- Lambda主要是用于实现核心的业务逻辑,串联整个流程。
- Glue用于进行离线的知识构建。
部署文档:https://upgt6k0dbo.feishu.cn/docx/GiLZd1glmo0l06xNRDmcr4P1nBf
Workshop:https://catalog.us-east-1.prod.workshops.aws/workshops/158a2497-7cbe-4ba4-8bee-2307cb01c08a/zh-CN
源代码:https://github.com/aws-samples/private-llm-qa-bot/tree/main