“汇聚未来”云端求贤 · 上海阶跃星辰智能科技有限公司

【实习】Agent RL 算法研究员

薪资面议  /  上海

今天 15:58 更新

我要推荐 内部推荐

若你发现本职位存在违规现象,欢迎举报。

提交成功

3s后自动关闭

举报职位

职位属性

招聘类型:校招
工作性质:实习

职位描述

1.RL-enhanced LLM Agent:结合强化学习环境,构建具备记忆、反思、规划、自进化及工具调用能力的类人智能体。

2.Multi-Agent systems:研究多个智能体如何高效协作,以完成超越单个智能体能力范围的任务。

3.Omni-LLM-based Agent:开发融合文本、语音、图像多模态的智能体。

4.World Model:探索AI系统如何构建自身与外部世界的认知与期望模型。

5.数据迭代流程优化:深入理解数据需求,推动人机协同的数据迭代流程,实现从人工到半自动化再到自动化的转变。

任职条件

1.教育背景:国内外高校研究生在读,具备良好的计算机或数学基础,拥有较强的编码能力。

2.技术背景:具有LLM(大语言模型)、强化学习、推理模型等相关背景,熟悉主流大语言模型的算法架构。

3.对齐方法:了解Alignment领域的常用方法,包括但不限于SFT、DPO、PPO、Self-Rewarding和Self-Critic等。

4.能力要求:具备卓越的实验分析与问题解决能力,拥有创新思维,能够进行良好的沟通,并与团队成员高效协作。

5.实习时间:一周三天以上,实习时间3个月以上

 

【加分项】

1.深度学习基础:具备深度学习、机器学习的基础知识,熟悉有监督学习、自监督学习等基本训练范式。

2.项目经验:在大语言模型方面有开源项目经验者优先,或曾通过机器学习算法解决过复杂问题。特别欢迎跨界研究者。

3.竞赛奖项:在 ACM/ICPC、NOI/IOI、Kaggle 等编程/AI 比赛获奖者优先。

4.学术成果: ICML、ICLR、NeurIPS、ACL、CVPR 等顶级学术会议发表过有影响力研究成果的优先

职位要求

  • 学历要求:硕士