【实习】Agent RL 算法研究员 - “汇聚未来”云端求贤

“汇聚未来”云端求贤

查看公司介绍

所有在招职位

招聘类型：校招

工作性质：实习

1.RL-enhanced LLM Agent：结合强化学习环境，构建具备记忆、反思、规划、自进化及工具调用能力的类人智能体。

2.Multi-Agent systems：研究多个智能体如何高效协作，以完成超越单个智能体能力范围的任务。

3.Omni-LLM-based Agent：开发融合文本、语音、图像多模态的智能体。

4.World Model：探索AI系统如何构建自身与外部世界的认知与期望模型。

5.数据迭代流程优化：深入理解数据需求，推动人机协同的数据迭代流程，实现从人工到半自动化再到自动化的转变。

1.教育背景：国内外高校研究生在读，具备良好的计算机或数学基础，拥有较强的编码能力。

2.技术背景：具有LLM（大语言模型）、强化学习、推理模型等相关背景，熟悉主流大语言模型的算法架构。

3.对齐方法：了解Alignment领域的常用方法，包括但不限于SFT、DPO、PPO、Self-Rewarding和Self-Critic等。

4.能力要求：具备卓越的实验分析与问题解决能力，拥有创新思维，能够进行良好的沟通，并与团队成员高效协作。

5.实习时间：一周三天以上，实习时间3个月以上

【加分项】

1.深度学习基础：具备深度学习、机器学习的基础知识，熟悉有监督学习、自监督学习等基本训练范式。

2.项目经验：在大语言模型方面有开源项目经验者优先，或曾通过机器学习算法解决过复杂问题。特别欢迎跨界研究者。

3.竞赛奖项：在 ACM/ICPC、NOI/IOI、Kaggle 等编程/AI 比赛获奖者优先。

4.学术成果： ICML、ICLR、NeurIPS、ACL、CVPR 等顶级学术会议发表过有影响力研究成果的优先

展开查看详情 