职位描述:
1定义分析清洗ASRTTS训练测试数据; 2开发高精度低延迟的端到端语音识别(ASR)系统,支持多语种多方言与个性化语音识别; 3研发自然富有表现力的神经语音合成(TTS)与歌声合成技术; 4分析评估ASRTTS产品性能改善产品性能; 5探索大模型与语音识别/合成的结合,提升模型在上下文理解与情感表达上的能力。 1硕及以上学历英语四级以上; 2深入理解语音识别/合成全链路,熟悉Kaldi, Espresso, Transformer等框架,对音素韵律学有研究; 3扎实的linuxpython功底; 4熟悉k2有TTS经验者优先。 举报
1定义分析清洗ASRTTS训练测试数据; 2开发高精度低延迟的端到端语音识别(ASR)系统,支持多语种多方言与个性化语音识别; 3研发自然富有表现力的神经语音合成(TTS)与歌声合成技术; 4分析评估ASRTTS产品性能改善产品性能; 5探索大模型与语音识别/合成的结合,提升模型在上下文理解与情感表达上的能力。 1硕及以上学历英语四级以上; 2深入理解语音识别/合成全链路,熟悉Kaldi, Espresso, Transformer等框架,对音素韵律学有研究; 3扎实的linuxpython功底; 4熟悉k2有TTS经验者优先。 举报
- 你可能感兴趣的职位
- 最近浏览记录
-
0.5-1万/月
-
5-6千/月
-
5-8千/月
-
2-3万/月
-
6-8千/月
-
2-3万/月
-
2-2.5万/月
-
面议
- 公司规模:50 - 99人
- 公司性质:私营企业
- 所属行业:IT行业-计算机、互联网、通讯、电子、仪器仪表等
- 所在地区:广东-深圳市-南山区
联系方式
- 联系人:马明欣
- 手机:会员登录后才可查看
- 邮箱:会员登录后才可查看
- 邮政编码:
工作地址
- 地址:深圳市南山区西丽街道云城社区兴科一街深圳国际创新谷5栋C座303
