【26届】code大模型算法研究员/工程师 - “汇聚未来”云端求贤

“汇聚未来”云端求贤

查看公司介绍

所有在招职位

招聘类型：校招

工作性质：全职

1、负责代码数据的合成、清洗、权重分配、来源扩充等一系列工作，持续提高代码数据质量；

2、负责探究post training中如何有效提升模型代码能力，包括代码竞赛，SWE等场景；

3、负责探究RL技术在code场景的有效应用方法，做数据飞轮与RL技术的有效结合，提升模型的code场景表现能力；

4、专注于代码强化学习中的奖励模型（Reward Model）的优化和创新；包括探究合成数据进行代码奖励模型的训练、代码和SWE场景数据的合成与校验、组织标注人员进行代码数据的标注、前沿探究、强化学习过程中的可执行代码与单元测试的质量过滤和扩充等。

1、预计毕业时间介于2025年9月至2026年8月的国内外计算机、物理、数学等相关专业的博士或优秀研究生；

2、具备扎实的计算机科学功底和编程能力，熟悉常见算法和数据结构，具有良好的编程习惯；

3、熟悉语言模型的基本技术、模型结构，Post Training全流程，对AI的未来有信仰和工作热情。

【加分项】

1、有NOI、ACM/ICPC金牌获奖经历优先；

2、有高水平论文发表者优先，如ICLR, ICML, NeurIPS等会议；

3、具有较强的工程能力，能迅速熟悉公司内外部平台工具使用，具有主动提升效率的意识。

展开查看详情 