公司简介

岗位职责:
1. 运用ASR/TTS或端到端语音技术赋能情感语音对话,运用极致的工程架构及算法设计优化延时和情绪问题
2. 实时跟进语音生成领域的SOTA算法,并快速将其应用到实际业务场景中
岗位要求:
1. 在985/211或 QS Top150大学获得计算机、人工智能相关专业硕士学位(博士优先),在国际顶会(Neurips, ICLR, ICML等)发表过语音生成、语音识别、语音合成等相关技术领域的文章;
2. 深入了解目前主流的一些TTS相关工作,自己上手复现过,熟悉开源的TTS项目,例如cosyvoice1&2,GPT-Sovits等,并有过微调的经验。
3. 拥有强悍的工程能力,有在线上实际部署过整套低延时语音系统的经验;
4. 熟练掌握深度学习主流框架 Pytorch/Tensorflow 以及分布式训练框架 Deepspeed,有过自己用 Pytorch 手动搭建分布式训练系统经验的优先;
加分项:
1. 性格乐观开朗,强大的自驱力,认可大模型做情感陪伴这个场景,并对这个赛道抱有热忱;
2. 良好的沟通能力,和产运/工程团队深入交流协作,共同驱动业务目标。
计算机相关