百万英才汇南粤2025年N城联动秋季招聘活动(北京邮电大学专场) 2025年09月23日

多模态语音算法

职位类别 其它类 招聘数 2人
专业要求 最低学历要求 本科
薪金水平 33333~75000元 工作地点 海珠区

职责和要求

工作内容:1、承担在语音大模型等方向上技术的研究与开发。包括声音克隆、zero-shot语音合成、文生语音、语音翻译、ASR、音效生成等。2、承担背景音分离、降噪、说话人识别、VAD等语音基础技术的研发与工程化。3、负责相关算法在移动端、PC端、云端等场景的产品化落地。


职位要求:1、精通深度学习、大模型训练、音频信号处理等领域的基础技术与原理,熟悉SeedTTS、ChatTTS、CosyVoice、SenseVoice等模型和技术;
2、熟练掌握Python/C/C++语言,数据结构和算法基础扎实,了解CUDA开发和TensorRT;
3、熟练掌握Tensorflow、Caffe、pytorch等任一种深度学习框架。