职位描述:
作职责 1定义分析清洗ASRTTS训练测试数据 。 2开发高精度低延迟的端到端语音识别(ASR)系统,支持多语种多方言与个性化语音识别 。 3研发自然富有表现力的神经语音合成(TTS)与歌声合成技术 。 4分析评估ASRTTS产品性能改善产品性能 。 5探索大模型与语音识别/合成的结合,提升模型在上下文理解与情感表达上的能力。 任职资格 1硕及以上学历英语4级以上 。 2深入理解语音识别/合成全链路,熟悉Kaldi, Espresso, Transformer等框架,对音素韵律学有研究。 3扎实的linuxpython功底 。 4熟悉k2有TTS经验者优先。 举报
作职责 1定义分析清洗ASRTTS训练测试数据 。 2开发高精度低延迟的端到端语音识别(ASR)系统,支持多语种多方言与个性化语音识别 。 3研发自然富有表现力的神经语音合成(TTS)与歌声合成技术 。 4分析评估ASRTTS产品性能改善产品性能 。 5探索大模型与语音识别/合成的结合,提升模型在上下文理解与情感表达上的能力。 任职资格 1硕及以上学历英语4级以上 。 2深入理解语音识别/合成全链路,熟悉Kaldi, Espresso, Transformer等框架,对音素韵律学有研究。 3扎实的linuxpython功底 。 4熟悉k2有TTS经验者优先。 举报
- 你可能感兴趣的职位
- 最近浏览记录
-
2-5千/月
-
3-5千/月
-
1-1.5万/月
-
10-20万/年
-
8-18万/年
-
8-18万/年
-
3-8千/月
-
1.5-3万/月
- 公司规模:50 - 99人
- 公司性质:私营企业
- 所属行业:IT行业-计算机、互联网、通讯、电子、仪器仪表等
- 所在地区:广东-深圳市-南山区
联系方式
- 联系人:马明欣
- 手机:会员登录后才可查看
- 邮箱:会员登录后才可查看
- 邮政编码:
工作地址
- 地址:深圳市南山区西丽街道云城社区兴科一街深圳国际创新谷5栋C座303
