CN202010694750
CN111816166A
微信扫码查看/分享专利
|
摘要:提供一种声音识别方法、装置以及存储指令的计算机可读存储介质。所述声音识别方法包括:获取输入音频的时域特征;获取所述输入音频的频域特征;将所述输入音频的时域特征和所述输入音频的频域特征进行融合,并基于融合后的特征执行声音识别。 |
---|---|
Abstract: The invention provides a voice recognition method and device and a computer readable storage medium for storing instructions. The voice recognition method comprises the following steps of acquiring time domain features of an input audio, acquiring frequency domain features of the input audio, and fusing the time domain feature of the input audio and the frequency domain feature of the input audio,and executing voice recognition based on the fused features. | |
申请人: 字节跳动有限公司 北京大学 | |
Applicant: BYTEDANCE LTD; UNIV BEIJING | |
地址: 美国加利福尼亚州 | |
发明(设计)人: 黎吉国 许继征 张莉 王悦 马思伟 | |
Inventor: LI JIGUO; XU JIZHENG; ZHANG LI; WANG YUE; MA SIWEI | |
主分类号: G10L15/02 | |
分类号: G10L15/02 G10L15/16 G10L25/24 G06K9/62 G06N3/04 G06N3/08 | |
2020-11-10 | 实质审查的生效IPC(主分类):G10L15/02 |
2020-10-23 | 公开 |
主权项 | 1.一种声音识别方法,其特征在于,包括:/n获取输入音频的时域特征;/n获取所述输入音频的频域特征;/n对所述输入音频的时域特征和所述输入音频的频域特征进行融合,并基于融合后的特征执行声音识别。/n | ||||||||||||||||||
公开号 | 111816166A | ||||||||||||||||||
公开日 | 2020-10-23 | ||||||||||||||||||
专利代理机构 | 11286 北京铭硕知识产权代理有限公司 | ||||||||||||||||||
代理人 | 苏银虹 张云珠 | ||||||||||||||||||
颁证日 | |||||||||||||||||||
优先权 |
|
||||||||||||||||||
国际申请 | |||||||||||||||||||
国际公布 | |||||||||||||||||||
进入国家日期 |
类型 | 阶段 | 文献号 | 公开日期 | 涉及权利要求项 | 相关页数 |
Y | SEA | CN107610692A | 20180119 | 1-10 | 说明书第1-55段 |
A | SEA | CN108305616A | 20180720 | 1-10 | 全文 |
A | SEA | CN108305634A | 20180720 | 1-10 | 全文 |
Y | SEA | CN108899037A | 20181127 | 1-10 | 说明书第1-140段 |
A | SEA | CN109523993A | 20190326 | 1-10 | 全文 |
A | SEA | CN109584887A | 20190405 | 1-10 | 全文 |
A | SEA | CN109935243A | 20190625 | 1-10 | 全文 |
A | SEA | CN110047468A | 20190723 | 1-10 | 全文 |
类型 | 阶段 | 期刊文摘名称 | 作者 | 标题 | 涉及权利要求项 | 相关页数 |
A | SEA | 缪裕青;邹巍;刘同来;周明;蔡国永; | 基于参数迁移和卷积循环神经网络的语音情感识别 | 1-10 | 全文 | |
缪裕青;邹巍;刘同来;周明;蔡国永;: "基于参数迁移和卷积循环神经网络的语音情感识别" | ||||||
类型 | 阶段 | 书名 | 作者 | 标题 | 涉及权利要求项 | 相关页数 |