近日,阿里巴巴公开一项“语音识别方法及装置”相关专利,该专利于2019年7月4日申请,2021年1月22日公开,公开号为CN112259089A。
根据专利摘要,本申请实施例提供了一种语音识别方法及装置,涉及人工智能领域。其中,所述方法包括:获取第一音频样本的音频数据帧与第一音频样本对应的文本标注数据的上下文相关音素的第一强制对齐结果;基于第一强制对齐结果,确定第一音频样本的音频数据帧关于待训练的唤醒声学模型的音素标注数据;基于音素标注数据,对待训练的唤醒声学模型进行训练,其中,唤醒声学模型的输出层中设置有针对唤醒词的唤醒词相关输出部分和唤醒词无关输出部分。
通过本申请实施例,使得训练后的唤醒声学模型在兼顾语音唤醒性能的同时,能够有效降低对设备端的计算资源的使用。
阿里巴巴的这项专利很有可能用在智能设备上,如智能音响。2017年7月5日,阿里巴巴集团阿里云智能事业群推出AI智能终端品牌——天猫精灵,让用户以自然语言对话的交互方式,实现影音娱乐、购物、信息查询、生活服务等功能操作,成为作为消费者的家庭助手。
去年5月,在天猫精灵发布会上,提出了“双百计划”,即将投入 100亿元进行生态建设,与合作伙伴共同推出 100 款千万级智能产品。