热词功能允许用户将特定词汇添加到热词列表中,当识别结果与热词列表中的词汇发音相似时,系统根据热词的权重值调整识别得分,使热词更有可能被选为最终识别结果,从而提高对这些特定词汇的识别准确率,满足用户在不同场景下对特定词汇识别的特殊需求。配置后,系统会优先匹配用户上传的热词列表,减少误识别或漏识别情况。
● 核心优势:
○ 行业适配:医疗、法律、金融等垂直领域术语精准识别
○ 动态更新:支持实时增删改查,灵活应对业务变化
○ 多场景覆盖:适用于会议记录、客服对话、智能硬件等私有化部署或云端调用场景
您可以通过控制台手动创建热词或通过API接口创建热词,具体操作及适用场景如下:
操作步骤:
访问天翼AI开放平台,使用账号登录后进入控制台,点击左侧菜单选择语音相关产品(其他产品没有该入口);

点击左侧导航栏进入热词/敏感词管理页面,点击【创建热词表】按钮,按要求输入热词表名称、热词内容及需要绑定的应用ID,填写完成后点击提交完成热词表创建;

创建成功后,可在控制台对热词表进行增删改查并在相应应用和算法中使用;
适用场景:
● 首次使用热词功能,需快速验证效果
● 热词数量较少(如少于100条),或需可视化管理热词库
● 非技术用户,偏好图形化操作
操作步骤:
访问天翼AI开放平台,使用账号登录后进入文档中心;
选择 智能语音 → 语音大模型 → 热词接口文档 → 新增热词表 - 接口文档;
根据接口文档说明创建热词表,创建完成后可通过接口对热词表进行增删改查,并在相应应用和算法中使用;
适用场景:
● 需要批量创建或动态更新热词(如每日同步企业内部术语库)
● 与现有业务系统集成,实现热词管理的自动化(如通过CRM系统自动同步客户品牌名)
● 技术用户,熟悉HTTP请求及JSON格式
热词表:
1.热词表名称不能包含标点和特殊字符,且最多支持64个字符;
2.一个应用最多创建30个热词表,一个热词表中最多添加5000个热词(热词添加数量一定程度上会影响识别速度和效果,请慎重添加过多数量的热词);
热词:
1.每个热词不能少于2个或者大于20个字符(禁止单字热词,建议3-10个字);
2.仅支持汉字、空格与英文字母,不支持标点、其他特殊符号,包括阿拉伯数字;
3.英文热词要求全部大写,单词间用空格分割;
4.添加热词时最好带上下文,例如:"蚌埠天气预报" 的效果要好于 "蚌埠";
5.不要添加常见词(如支付宝,天安门等),最好可以在发现某个词无法被准确识别后,再添加;
6.添加的热词之间不要有包含关系(如同时添加:西四环北路,西四环北路辅路 2 个热词);
7.若想在热词中添加数字,请按照数字发音替换为相应的文字,例如:“523”设置为“五百二十三”;
在公安行业,为了提升行业专业用语的识别准确率,设置并应用标准化热词(如“警情分类编码”“重点人员管控”“智能预警模型”等)是提升执法效能、强化社会治理的重要手段,热词示例如下:
警情
案件
嫌疑人
抓捕
审讯
笔录
指纹
DNA
监控
巡逻
治安
刑事
毒品
枪支
管制刀具
盗窃
抢劫
诈骗
绑架
杀人
失踪人口
通缉令
协查通报
警戒线
警械
警车
警犬
110接警
出警
盘查
拘留
逮捕
取保候审
监视居住
侦查
预审
起诉
审判
社区警务
治安管理
创建完热词表后,在可用的算法中进行使用即可提升这些词汇被识别的概率。
敏感词功能允许用户将需要过滤或特殊处理的词汇添加到敏感词列表中,当语音识别结果中包含敏感词时,将根据预设的规则对这些敏感词进行标记(目前是以*代替),以确保识别结果符合法律法规、道德规范和特定场景的要求。
核心优势:
● 精准过滤,合规无忧:实时识别并替换敏感词汇,自动屏蔽违法、暴力、隐私等风险内容,确保输出结果符合法律法规及行业规范。
● 灵活定制,场景适配:支持自定义词库与替换规则(如全词/部分隐藏),可按公安、金融、教育等场景差异化配置,满足多样化业务需求。
● 高效降本,智能运维:减少人工审核工作量,降低内容安全风险,同时系统自动记录触发日志,便于追溯管理,提升整体运维效率。
您可以通过控制台手动创建敏感词或通过API接口创建敏感词,具体操作及适用场景如下:
操作步骤:
访问天翼AI开放平台,使用账号登录后进入控制台,点击左侧菜单选择语音相关产品(其他产品没有该入口);

点击左侧导航栏进入热词/敏感词管理页面,点击【创建敏感词表】按钮,按要求输入敏感词表名称、敏感词内容及需要绑定的应用ID,填写完成后点击提交完成敏感词表创建;


创建成功后,可在控制台对敏感词表进行增删改查并在相应应用和算法中使用;
适用场景:
● 首次使用敏感词功能,需快速验证效果
● 敏感词数量较少(如少于100条),或需可视化管理敏感词库
● 非技术用户,偏好图形化操作
操作步骤:
访问天翼AI开放平台,使用账号登录后进入文档中心;
选择 智能语音 → 语音大模型 → 敏感词接口文档 → 新增敏感词表 - 接口文档;
根据接口文档说明创建敏感词表,创建完成后可通过接口对敏感词表进行增删改查,并在相应应用和算法中使用;
适用场景:
● 需要批量创建或动态更新敏感词(如每日同步企业内部术语库)
● 与现有业务系统集成,实现敏感词管理的自动化(如通过CRM系统自动同步客户品牌名)
● 技术用户,熟悉HTTP请求及JSON格式
1、敏感词表名称不能包含标点和特殊字符,且最多支持64个字符
2、敏感词不能少于1个或者不能大于50个字符,且敏感词不能包含标点、阿拉伯数字和特殊字符
3、 一个应用最多创建30个敏感词表,一个敏感词表中最多添加5000个敏感词(敏感词添加数量一定程度上会影响识别速度,请慎重添加过多数量的敏感词)
4、 若想在敏感词中添加数字,请按照数字发音替换为相应的文字,例如:“523”设置为“五百二十三”;