有奖捉虫:办公协同&微信生态&物联网文档专题 HOT
腾讯云语音识别服务对于常用词汇的识别效果极佳,但对一些特有的人名、产品名、公司名或者某个领域的专有词汇,例如:品牌名智聆、建筑名滨海大厦、保险领域专业词汇核保、云存储专业词汇存储桶、原创食品名金尊披萨等,可能存在识别准确率降低的情况。对于这些专有词汇,腾讯云语音识别提供了热词功能供用户使用,添加热词可以显著提升通用引擎在这类专有词汇上的识别准确率。

功能介绍:热词

在热词功能中,我们开放了通用热词、超级热词、热词增强版三个维度的热词能力供客户使用,热词生效强度依次增加其中“热词增强版”是我们首创的热词支持形式之一,开启“热词增强版”以后可以极大提升语言模型的识别准确率。这三个功能介绍如下:
热词功能
热词生效等级
说明
通用热词
一般
“通用热词”强度最低,但对整体数据集的 WER(Wer Error Rate,字错率)影响最小。因此,通用热词级别的热词根据上下文语义不同,有一定概率不生效。通用热词的权重范围为[1,10],数值越大生效概率越大。
超级热词
中等
“超级热词”对词表相关内容识别准确率相比通用热词有极大提升。创建热词表或每次请求直接传入临时热词表时,若热词权重设置为11,当前热词将升级为超级热词
不过,超级热词的生效将在一定程度上影响整体识别的 WER,因此建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体数据集的字准率
热词增强版
必现
(发音相同时)
在使用“通用热词”、“超级热词”功能效果不显著的情况下(如:部分热词因为同音词过多,即使进行了配置,模型输出的概率变化也不大),使用“热词增强版”可开启同音同调替换的能力,可以极大提升相关热词的输出概率若热词权重设置为100,当前热词将升级为热词增强版。
举例:在热词表中配置热词“蜜制”后,选择开启热词增强版,则与“蜜制”同音同调的“秘制”(mìzhì)的识别结果会被替换成“蜜制”。因此建议客户根据自己的实际情况谨慎开启此功能
热词增强版开启方式请查看 支持范围 中的语音识别基础产品各接口文档和参数说明。

功能介绍:临时热词表

临时热词表:临时热词表是一种在请求中带入热词组的调用方式,不受热词表创建数量、热词创建数量限制。适用于单次请求中有大量热词需求、且需要频繁切换热词的用户(如:开放热词功能给到C端用户进行配置的情况)。临时热词表无需事先创建热词表,在每次请求时直接传入临时热词表即可使用热词功能,云端不会保留每次传入的临时热词表。
注意:
?临时热词表 仅适用于通过接口调用语音识别服务的客户。临时热词表热词 在功能层面互相独立,如客户在调用接口时同时传入两者,将只会生效临时热词表中的热词。具体调用方法请见 支持范围 中的语音识别基础产品各接口文档和参数说明。
临时热词表功能暂不支持 MRCP 协议。

支持范围

语音识别基础产品
通用热词参数
超级热词
热词增强版
临时热词表
支持语种
使用方式
HotwordId
将通用热词参数中的热词权重调整至11
将通用热词参数中的热词权重调整至100
暂不支持
所有中文普通话模型
所有英文模型
所有粤语模型
(包括含中文普通话、英文、粤语的混合模型)
请注意:热词增强版仅支持各子产品中的中文普通话模型
支持通过 API直接调用 控制台配置 两个方式使用热词
请注意:临时热词表在每次请求时直接传入即可使用
hotword_id
hotword_list
hotword_id
hotword_list
HotwordId
hotword_list
HotwordId
暂不支持
暂不支持

使用建议

常见的通用词汇不建议加入热词,例如“客户”、“朋友”等词汇,加入过多的通用词汇会降低专有词汇的识别率。
热词权重越大,被识别出来的概率越大,热词权重的范围为[1,11]之间的整数,以及数值100,具体对应关系如下:
当热词权重设置为1-10之间,热词为通用热词,生效强度随数值变大而增大;
当热词权重设置为11时,热词将升级为超级热词。建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率;
当热词权重设置为100时,热词将升级为热词增强版。热词增强版为同音替换功能,请谨慎开启。
热词的添加可以极大提升识别准确率,是快速提升专有领域词汇的重要途径之一,但是仍可能存在无法正确识别的概率。请首先确认音频的清晰度和质量是否达标,达标的标准是普通人听一遍录音就能正确识别出文字。
使用时无需区分热词词性或所属实体类型。
热词表在创建时无需关联引擎。
临时热词表与热词参数在功能层面互相独立,如客户同时传入两者参数,将只会生效临时热词表中的热词。具体调用方法请见 支持范围 中的语音识别基础产品各接口文档和参数说明。

使用限制

默认每个账号最多可创建30个热词表,每个热词表最多可添加1000个热词每个热词最长10个字,不能超出限制(如有超过限制的需求,请使用 自学习模型)。
热词表文件必须为 UTF-8 GBK 编码格式,每行仅添加一个热词和对应权重(热词和权重间用英文符号|隔开),不能包含标点和特殊字符。详见 热词示例
同一个账号最多可以设置1个默认热词表(但最多可以创建30个)。如果在调用语音识别服务时,不进行单独的热词表 ID 设置,则自动生效默认热词表;如果进行单独的热词表 ID 设置,那么将生效单独设置的热词表 ID。
临时热词表最多可添加128个热词,多个热词用英文逗号分割,如:“腾讯云|10,语音识别|5,ASR|11”。

热词生效流程

客户通过 API直接调用 控制台配置 两个方式创建热词表并获取热词表 ID
产品后端服务将热词表配送至识别层(由后端服务完成,客户无感知)
客户发起语音识别请求,并传入热词表 ID(如不传入热词表 ID,则生效默认热词表)
识别层根据请求传入的热词表 ID 生效对应的热词表(由后端服务完成,客户无感知)

热词使用方法一:通过API创建并使用

您可以通过调用下述接口,自行对热词进行创建、删除、更新、设置等操作,无需依赖控制台的操作:
?创建热词表:用户通过本接口添加热词,添加成功后会返回给用户热词表 ID,然后用户可以通过在请求语音识别服务时,对热词参数设置对应的热词表 ID 的方式使用。
?删除热词表:用户通过本接口进行热词表的删除。
?下载热词表:用户通过本接口进行热词表的下载,获得词表权重文件形式的 base64 值,文件形式为通过 “|” 分割的词和权重,即 word|weight 的形式。
?获取热词表:用户根据词表的ID可以获取对应的热词表信息。
?列举热词表:用户通过该接口,可获得所有的热词表及其信息。
?设置热词表状态:用户通过该接口可以设置热词表的默认状态。初始状态为0,用户可设置状态为1,即为默认状态。默认状态表示用户在请求识别时,如不设置热词表 ID,则默认使用状态为1的热词表。
?更新热词表:用户通过本接口进行对应的词表信息更新。
对于每个语音识别请求,同时只能有一个热词表起作用,但不同的请求可以使不同的热词表生效。针对不同语音识别子产品的请求说明如下:
语音识别子产品
接口文档连接
接口对应热词参数名
如何定义请求
录音文件识别
HotwordId
每个 HTTP请求
实时语音识别
hotword_id
每个音频流
录音文件识别极速版
hotword_id
每个 HTTP 请求
一句话识别
HotwordId
每个 HTTP 请求
语音流异步识别
HotwordId
每个音频流

热词使用方法二:通过控制台配置

1. 新建热词表和热词

(1)登录 语音识别控制台,单击左侧菜单栏热词,进入热词管理页面,单击新建热词
?
?
(2)在弹出页面中填写热词名、热词文件、标签,填写完成后,单击确定即可成功新建热词。热词文件书写要求,可参见 使用限制
说明
标签:用于从不同维度对资源分类管理。如现有标签不符合您的要求,可在控制台中 管理标签
?
?
(3)设置热词成功后,单击通过 语音识别 API 或 SDK 测试识别效果。

2. 查看列表

登录 语音识别控制台,单击左侧菜单栏热词,进入热词列表页。在热词列表页,可对热词进行设置默认、更新、下载、删除和编辑标签操作。单击操作列中的对应按钮,即可进行相应的操作。
?
?

3. 更新热词

在热词列表中,选择操作 > 更新编辑热词,在弹出页面单击更换文件,文件更换完成后,单击确定即可。
?
?

4. 设置默认热词

在热词列表中,选择操作 > 设置默认,在弹出页面中将该热词设置为默认热词。热词设为默认后,调用服务时默认生效,无需进行参数设置。
?
?
?

5. 下载热词

在热词列表中,选择操作 > 下载,可直接下载热词。

6. 删除热词

在热词列表中,选择操作 > 删除,在弹出页面中单击确定,即可删除热词。删除后,热词数据和效果均无法恢复。
?
?
?

7. 编辑标签

在热词列表中,选择操作 > 编辑标签,在弹出页面中设置标签键和标签值,也可同时设置多个标签键和标签值,设置完成后,单击确定即可。
?
?

8. 热词示例

可在 语音识别控制台-热词 中单击新建热词上传热词表文件,进行热词添加,热词文件示例如下(无需区分热词词性或所属实体类型):
?
?
?
例如:“孔银”、“聊币玄”、“李朝辉”、“罗倾听”这样的专业词汇,可以参照上述示例添加热词,热词权重越大,识别的效果越好。
注意:其中的数字推荐按照发音替换为对应汉字,例如“689元”替换为“六百八十九元”。
?


http://www.vxiaotou.com