“汇聚未来”云端求贤 · 上海阶跃星辰智能科技有限公司

【26届】code大模型算法研究员/工程师

薪资面议  /  上海

今天 15:58 更新

我要推荐 内部推荐

若你发现本职位存在违规现象,欢迎举报。

提交成功

3s后自动关闭

举报职位

职位属性

招聘类型:校招
工作性质:全职

职位描述

1、负责代码数据的合成、清洗、权重分配、来源扩充等一系列工作,持续提高代码数据质量;

 

2、负责探究post training中如何有效提升模型代码能力,包括代码竞赛,SWE等场景;

 

3、负责探究RL技术在code场景的有效应用方法,做数据飞轮与RL技术的有效结合,提升模型的code场景表现能力;

 

4、专注于代码强化学习中的奖励模型(Reward Model)的优化和创新;包括探究合成数据进行代码奖励模型的训练、代码和SWE场景数据的合成与校验、组织标注人员进行代码数据的标注、前沿探究、强化学习过程中的可执行代码与单元测试的质量过滤和扩充等。

 

 

任职条件

1、预计毕业时间介于2025年9月至2026年8月的国内外计算机、物理、数学等相关专业的博士或优秀研究生;

2、具备扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程习惯;

3、熟悉语言模型的基本技术、模型结构,Post Training全流程,对AI的未来有信仰和工作热情。

 

【加分项】

1、有NOI、ACM/ICPC金牌获奖经历优先;

2、有高水平论文发表者优先,如ICLR, ICML, NeurIPS等会议;

3、具有较强的工程能力,能迅速熟悉公司内外部平台工具使用,具有主动提升效率的意识。

职位要求

  • 学历要求:硕士