为了保证知识库检索的效果,平台支持单独对知识库进行检索命中测试。

1. 知识检索设置
支持用户选择三种检索形式中的任意一种,进行片段召回测试。
- 混合检索:同时执行全文检索和语义检索,结合语义查询和关键词查询,提升检索效果。
- 权重设置:调整全文检索与语义检索之间的比重关系
- 允许用户赋予语义优先和关键词优先自定义的权重。
- 全文检索指的是在知识库内进行关键词检索,语义检索指的是在知识库内进行向量检索。
- 支持自定义关键词和语义权重,调节两种检索方式结果占比。
- 语义检索指的是比对用户问题与知识库内容中的向量距离。距离越近,匹配的概率越大。
- 全文检索:关键词检索,即索引文档中的所有词汇。用户输入问题后,通过明文关键词匹配知识库内对应的文本片段,返回符合关键词的文本片段;类似搜索引擎中的明文检索。
- 语义检索:通过向量化用户输入的问题并生成查询向量,比较查询向量与知识库内对应的文本向量距离,寻找最近的分段内容。通过生成查询嵌入并查询与其向量表示最相似的文本分段。
- 最大召回片段数: 用于筛选与用户问题相似度最高的文本片段。系统默认值为 3,数值越高,预期被召回的文本分段数量越多 。可选择范围是1-10。
- 重排模型:开启“结果重排”后,系统会对已召回的文档结果再一次进行重排序,优化排序结果。开启结果重排后,根据用户自定义的相似度匹配值,进行召回;未开启结果重排,内容展示为分数相关信息。
- 相似度匹配值: 用于设置文本片段筛选的相似度匹配值,只召回超过设置分数的文本片段。打开后默认值为 0.5 。可选择范围是0-1。数值越高说明对于文本与问题要求的相似度越高,预期被召回的文本数量也越少。
- 根据用户输入的最大召回片段数,可召回相应的片段。
2. 命中历史
- 页面左下方展示当前知识库检索历史记录,其中包含召回测试的检索记录和智能体应用中对该知识库检索的记录。
- 在输入框中输入待测试的内容,系统会根据检索配置进行召回测试,并将结果展示在右侧展示。