“百万英才汇南粤”2025年N城联动春季招聘活动(北京站)——中国人民大学校园专场 2025年04月20日

语音大模型算法

职位类别 不限 招聘数 1人
专业要求 最低学历要求 博士
薪金水平 面议 工作地点 广州市

职责和要求

职责描述:
1.负责端对端语音大模型等方向上技术的研究与开发。包括但不仅限于声音克隆、zero-shot语音合成、文生语音、语音转换、ASR等;
2.负责端对端语音大模型的业务场景应用和效果优化;
3.调研和复现业界先进的技术框架,提升自研模型的效果和推理性能;

任职要求:
1、要求人工智能、计算机类、数学类,信号处理等相关专业
2、熟练掌握C/C++/python,较强的编码实现能力;
3、熟练使用tensorflow/pytorch至少一种深度学习框架,理解深度学习基础理论,有相关平台算法项目经验;
4、精通深度学习、大模型训练、音频信号处理等领域的基础技术与原理,熟悉SeedTTS、ChatTTS、CosyVoice、SenseVoice等模型和技术;
5、对岗位所述方向有强烈的兴趣,自驱并敢于挑战,性格开朗,有合作精神;
6、具有语音大模型实际项目经验优先;

加分项:
在相关国际会议或主流期刊上发表论文者优先(ICASSP,Interspeech,ASRU)