“汇聚未来”云端求贤 · 上海阶跃星辰智能科技有限公司

【实习】Post-Train & Agent 算法实习生

薪资面议  /  上海

今天 15:58 更新

我要推荐 内部推荐

若你发现本职位存在违规现象,欢迎举报。

提交成功

3s后自动关闭

举报职位

职位属性

招聘类型:校招
工作性质:实习

职位描述

1、研究实用的后对齐RL算法,打造稳定鲁棒的reasoning+agent的RL训练体系;

2、探索超大规模模型,并进行极致系统优化;

3、基础模型后训练端到端指标优化;

4、Code Agent与通用Agent的数据建设和模型优化;

5、Agent真实应用场景的优化探索。

任职条件

1、国内外高校研究生在读,人工智能、计算机、自动化、数学相关专业优先;

2、扎实的机器学习基础,熟悉NLP、RL领域的技术,在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶级会议上发表论文者优先;

3、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;

4、在大模型领域、Agent领域或RL领域,主导过大影响力的项目或论文者优先;

5、出色的问题分析和解决能力,能深入解决大模型训练和应用存在的问题,有自主探索解决方案的能力;

6、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。

职位要求

  • 学历要求:硕士