公司简介

岗位职责:
1. 负责将传统NLP、大模型、强化学习等技术运用到情感陪伴场景中,打造双商兼具的情感陪伴大模型;
2. 构建高效鲁棒的线上数据飞轮系统,从海量数据中精准定位 good/badcase,搭建及优化从问题数据分析到模型优化的快速迭代系统;
3. 日常跟进最新的大模型 post-training 相关技术,能够在业务场景中快速切入,验证其有效性。
岗位要求:
1. 在985/211或 QS Top150 大学获得计算机、人工智能相关专业硕士学位(博士优先);在国际顶会(Neurips, ICLR, ICML等)发表过大模型 Post-training 相关论文者优先;
2. 对主流大模型(GPT,o1,LLaMA,GLM,T5等)的结构、原理和训练方式有深入的理解;
3. 有在垂直领域微调大模型的经验,数据 sense 良好,对训练垂域大模型的数据配比、badcase 分析等有深入认知,有自己的方法论;
4. 强悍的工程能力,熟练掌握主流深度学习框架 Pytorch/Tensorflow 及大模型训练分布式框架 Deepspeed/Megatron-LM 多机多卡方案,有过基于 Deepspeed 框架训练百亿、千亿参数模型的经验;
5. 熟练掌握 RLHF 相关技术细节,有过 RLHF 微调百亿、千亿参数大模型的经验者优先。
加分项:
1. 性格乐观开朗,强大的自驱力,认可大模型做情感陪伴这个场景,并对这个赛道抱有热忱;
2. 良好的沟通能力,和产运/工程团队深入交流协作,共同驱动业务目标;
3. 有强化学习背景。
计算机相关