基于端到端语音识别能力,将批量上传的音频文件转换成文本,适用于语音质检、会话内容分析等场景
话者分离 :当录音中有多个说话人时,可以区分不同说话人进行识别
智能优化 :根据语音内容,自动插入适当的标点符号,输出标准化文本形式,并能够对识别结果进行智能验证和修正,提高文本的可读性
字体选择 :能够生成简体和翻译的转写结果,支持用户根据场景进行选择
语义断句 :根据音频内容的语义和语调特征,将连续语音分段为完整句子,自动插入标点,使识别结果更符合自然语言表达
支持热词 :用户能够自定义上传的热词,通过优先匹配热词提升在相关领域的识别准确性

注:如返回网关错误码(见开发指南->公共常量->返回状态码),不做计费