【实习】Post-Train & Agent 算法实习生 - “汇聚未来”云端求贤 - 仟寻招聘

{"joinUsHref":"\/company\/650","corp_year":"2025","staticUrl":"\/\/cdn.moseeker.com\/athena","uploadUrl":"\/","jdListUrl":"\/","editProfileUrl":"\/profile\/edit","accountSettingUrl":"\/accounts\/settings","logoutUrl":"\/accounts\/logout","loginUrl":"\/accounts\/login?fromUrl=%2Fjob%2F3372523","registerUrl":"\/accounts\/register?fromUrl=%2Fjob%2F3372523","modules":{"login":{"bindAction":"no","urls":{"getWeiXinQRImage":"\/wechat\/getqrcode","getWeiXinQRBindStatus":"\/wechat\/getbindcodestatus?fromUrl=%2Fjob%2F3372523","getWeiXinRegisterQRImage":"\/wechat\/getregisterqrcode","getWeiXinRegisterQRStatus":"\/wechat\/getregisterqrcodestatus?fromUrl=%2Fjob%2F3372523","verifyCodeUrl":"\/accounts\/dosendsignupcode\/uid","bindPhoneUrl":"\/accounts\/dowxbindmobile\/uid","registerUrl":"\/accounts\/register?fromUrl=%2Fjob%2F3372523","forgotpasswordUrl":"\/accounts\/forgetpassword?fromUrl=%2Fjob%2F3372523","mobileLoginUrl":"\/accounts\/commonlogin","weixinLoginUrl":"https:\/\/open.weixin.qq.com\/connect\/qrconnect?appid=wx5dc1a7ad6214ad74&redirect_uri=https%3A%2F%2Fwww.moseeker.com%2Faccounts%2Fcallback%2Ftype%2Fweixin%3Freflink%3DDdjFm-RWsyYzHGtu4NCIahpNsrLi2SpdGSneZslBoSjY98vhZ1gIP4HCZpYbbFXxz-f0CVM51no4xc65hrTyPw&response_type=code&scope=snsapi_login&style=white&href=https%3A%2F%2Fcdn.moseeker.com%2Fathena%2Fstatic%2Fstylesheets%2Fcustom_scan_login.css","fetchNationalCodeList":"\/dictionary\/getsmscountrycodes"}},"remind":{"followWeixin":false}},"isLogin":false,"account":{"username":"","logo":null,"userId":null}}

“汇聚未来”云端求贤 · 上海阶跃星辰智能科技有限公司

【实习】Post-Train & Agent 算法实习生

薪资面议 / 上海

今天 15:58 更新

举报职位

公司简介

“汇聚未来”云端求贤

查看公司介绍

所有在招职位

所属团队

上海阶跃星辰智能科技有限公司

16个职位在招

职位属性

招聘类型：校招

工作性质：实习

职位描述

1、研究实用的后对齐RL算法，打造稳定鲁棒的reasoning+agent的RL训练体系；

2、探索超大规模模型，并进行极致系统优化；

3、基础模型后训练端到端指标优化；

4、Code Agent与通用Agent的数据建设和模型优化；

5、Agent真实应用场景的优化探索。

任职条件

1、国内外高校研究生在读，人工智能、计算机、自动化、数学相关专业优先；

2、扎实的机器学习基础，熟悉NLP、RL领域的技术，在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶级会议上发表论文者优先；

3、优秀的代码能力、数据结构和基础算法功底，熟练C/C++或Python，ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先；

4、在大模型领域、Agent领域或RL领域，主导过大影响力的项目或论文者优先；

5、出色的问题分析和解决能力，能深入解决大模型训练和应用存在的问题，有自主探索解决方案的能力；

6、良好的沟通协作能力，能和团队一起探索新技术，推进技术进步。

职位要求

学历要求：硕士

展开查看详情 