公司简介
“汇聚未来”云端求贤
1、研究实用的后对齐RL算法,打造稳定鲁棒的reasoning+agent的RL训练体系;
2、探索超大规模模型,并进行极致系统优化;
3、基础模型后训练端到端指标优化;
4、Code Agent与通用Agent的数据建设和模型优化;
5、Agent真实应用场景的优化探索。
1、国内外高校研究生在读,人工智能、计算机、自动化、数学相关专业优先;
2、扎实的机器学习基础,熟悉NLP、RL领域的技术,在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶级会议上发表论文者优先;
3、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
4、在大模型领域、Agent领域或RL领域,主导过大影响力的项目或论文者优先;
5、出色的问题分析和解决能力,能深入解决大模型训练和应用存在的问题,有自主探索解决方案的能力;
6、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。