1. 创建应用
- 登录智能体应用开发平台。
- 在页面左上角的创建应用按钮或我的应用页面中右侧的创建应用按钮。
- 必须输入应用名称和应用描述、选填标签内容,使用内置头像或单击头像图标上传自定义头像。
- 支持用户自定义标签(应用模块标签上限10个),并在创建应用的时候选择标签。
2. 配置应用
在左侧智能体配置区域,设置智能体的人设与编排逻辑、为智能体添加工具、知识库和添加对话配置等,并在右侧预览区域通过与智能体对话查看并调试效果。
2.1 角色指令
通过角色指令为智能体设定身份、任务和回复逻辑等信息,大模型会根据角色身份设定和任务进行理解和回复。
优化:当用户未填写角色指令时,支持根据应用名称和描述生成角色指令 ;当用户填写角色指令后,支持根据底层策略优化生成角色指令;同时也支持根据用户输入的优化点修改角色指令。
模板:
- 导入模板:支持用户使用平台预置模板,适合不会编写模板的用户,可以根据适合的场景选择适合的模板,并在模板基础上进行微调,降低用户的操作复杂度;支持用户使用。
- 创建为模板:支持用户将调试角色指令创建为模板,供其他智能体使用。

2.2 知识库:
知识库内存储专业领域的知识或内部信息,用于提高智能体应用在特定场景下回复的准确性。
点击知识库右侧加号可以添加已完成创建的知识库。知识库创建方法详见知识库章节。

召回设置:针对整个应用的知识库进行配置,配置中包含混合检索、全文检索、语义检索、参数设置及引用归属设置。

引用和归属:用于配合知识库功能共同使用,显示大模型根据知识库内的内容回复时调用知识库数据的源文档。

2.3 数据库:
可上传本地表格数据构建数据库。用户询问数据表内的问题时,应用能够查询数据并答复。
应用最多可关联1个数据库。
点击数据库右侧加号可以添加已创建的数据库。数据库创建方法详见数据库章节。

2.4 工具:
点击工具右侧的加号添加工具,不同工具可以拓展智能体能力边界。例如,在您的智能体内添加天气搜索插件,那么您的智能体将拥有搜索天气的能力。 部分内置工具导入时需要经过工具方的授权并添加API Key。
如果平台内置的工具不满足需求,你还可以创建并添加自定义工具来集成其他能力。自定义工具创建方法详见工具章节。

2.5 长期记忆:
可将提炼对话核心内容,将长期记忆的关键信息存储在记忆库中,以优化和个性化未来的响应。
应用最多可关联1个记忆库。
点击记忆库右侧加号可以添加已创建的记忆库。记忆库创建方法详见记忆库章节。

2.6 高级对话配置:
2.6.1 开场白:用户进入智能体应用后自动展示的引导信息,帮助用户理解智能体的能力和用途。在开启开场白后还可以设置预置问题,用户点击后可快速开始智能体对话。

2.6.2 追问:在智能体回复后,大模型会自动根据对话内容提供 3 条用户提问建议,帮助用户继续与智能体进行多轮对话。

2.6.3 会话背景图:用户可添加会话背景图,美化聊天背景,调试过程中会展示在预览调试区,发布后同步展示于应用广场或前端页面。

2.6.4 语音输入:打开语音输入功能,支持用户语音输入内容,会根据用户语音输入的文本展现在文本框输入处。文字阅读的音色会根据用户的选择进行播放。【依赖研究院算法】

2.6.5 语音对话:
- 打开语音对话功能,支持用户以对话的形式输入内容,会根据用户语音输入的文本直接通话回复,文本展示在预览调试区。文字阅读的音色会根据用户的选择进行播放。

2.6.6 预解析文件:
功能开启后,支持用户上传文件类型为文档、图片、音频、视频,支持上传两个文件,每个文件不超过10mb。
- 文档支持:,DOC,DOCX,WPT,WPS,PDF,PPT,PPTX,XLS,XLSX,CSV,JSON,JSONL,ET,ETT,MD,TXT。
- 图片支持:.JPG,.JPEG,.PNG,.WEBP
- 音频支持:.MP3,.M4A,.WAV(依赖模型,底层开关默认关闭,配置模型后可开启)
- 视频支持:.MP4,.WEBM(依赖模型,底层开关默认关闭,配置模型后可开启)
- 支持用户调整单文件最大解析长度占比和最大拼装长度占比两个参数。
- 默认参数是50%,支持调整范围是1-80%
- 支持用户针对上传的文件进行对话问答。


2.6.7 预览:在预览调试区域,向智能体发送消息,测试智能体效果。同时可以针对回复的内容,进行点赞或点踩。

2.7 模型配置
在该区域板块内,用户可选择对应的模型并进行相关参数配置。
- 模型选择:支持选择内置模型和第三方模型进行对话。

- 生成多样性配置
- 该参数用于控制随机性和多样性的程度,具体来说,生成多样性参数值控制了生成文本时对每个候选词概率的分布进行平滑的程度。较高的参数值会降低概率分布的峰值,使得更多的低概率词被选择,生成结果更加多样化;而较低的参数值则会增强概率分布的峰值,使得高概率词更容易被选择,生成结果更加确定。
- 参数模式
- 常规模式:也可称为标准模式或平衡模式,是大模型默认的运行方式。它兼顾创意与准确性,试图在提供足够信息和保持对话语气之间取得平衡。适合大多数日常交流场景,如日常沟通、信息查询等,能快速提供一些较为合理的答案和建议。
- 精准模式:注重事实和准确性,像一个严谨的专家,专注于提供准确、可靠的信息。该模式下模型会严格按照指令执行任务,尽可能减少歧义,输出结果具有较高的确定性和可预测性。适用于专业咨询、数据分析、重要决策等需要精确结果的场景。
- 创意模式:旨在激发灵感,让模型尽可能地生成富有想象力、原创性强的内容。模型输出会更加自由和多样化,可能会偏离主题或产生一些非常规的想法。适合用于头脑风暴、创意写作、娱乐消遣等场景,能为用户提供一些意想不到的灵感和素材。
- 自定义模式:允许用户根据自身需求对模型的输出方式进行个性化设置。用户可以通过上传文本样本,让模型学习特定的语言风格,也可以直接描述期望的交互方式,如指定语言风格、回答长度、格式要求等,使模型的输出无限贴近个人写作风格和需求。
- 高级参数配置
- 平台支持对以下参数根据用户使用场景需要做自定义设置,不同的模型存在不同的参数值,以下仅做示例。
- 最大标记:用于指定模型在生成内容时token的最大数量,它定义了生成的上限,但不保证每次都会生成到这个数量。
- Top P:生成过程中核采样方法概率阈值,例如,取值为0.8时,仅保留概率加起来大于等于0.8的最可能token的最小集合作为候选集。取值范围为(1,1.0),取值越大,生成的随机性越高;取值越低,生成的确定性越高。
- 取样数量:生成时,采样候选集的大小。例如,取值为50时,仅将单词生成中得分最高的50个token组成随机采样的候选集。取值越大,生成的随机性越高;取值越小,生成的确定性越高。
- 随机种子:生成时使用的随机数种子,用户控制模型生成内容的随机性。支持无符号64位整数,默认值为1234。在使用seed时,模型将进坑生成相同或相似的结果,但目前不保证每次生成的结果完全相同
- 重复惩罚:用于控制模型生成时的重复度。提高repetition_penalty时可以降低模型生成的重复度。1.0表示不做惩罚。
- 回复格式:设置一个返回格式,确保LLM的输出尽可能是有效的代码块,如JOSN、XML等。
- 多模型对比
- 为了用户可以更直观的对比同一角色指令和能力拓展配置下,不同模型的运行效果,帮助用户更快的选择最优模型,平台提供了多模型对比功能。
- 支持最多选择4个模型进行对比,基于相同的问题,输入,关注模型的输出,对比不同的模型输出的效果差异度。确认最优模型后,点击“最优模型”按钮开关,保留最优模型。
