公司简介

“汇聚未来”云端求贤
职位描述:
1. 参与大语言模型强化学习算法的研发,提升模型在强化学习阶段的训练效率,并增强其在数学、代码等自然科学领域的推理能力;
2. 参与复现Deepseek R1等推理大模型的工作;
3. 参与思维链生成技术的理论验证与开发;
4. 撰写技术文档和论文,记录研究成果并促进知识共享。
职位要求:
1.硕士及以上学历,计算机相关专业,熟练掌握计算机学科的专业知识;
2.熟悉强化学习算法且有相关实验经验,熟练掌握prompt工程,对思维链生成有相关研究经验者优先;
3.有ACL、NeurIPS、CVPR、ICML、ICLR、EMNLP、AAAI等顶会/刊论文发表经验者优先;
4.熟悉REINFORCE、GRPO等算法优先;
本次实习你可以获得什么:
1.提供丰富的算力,欢迎你来实验任何你觉得有价值的想法,给一个证明自己的机会。
2.提供有挑战的工作机会,参与前沿方向的研究,有机会发表对行业有价值的高水平论文,在过去2年,团队保持每年10篇以上的CCF A论文产出。
表现优秀者可提供转正机会!
计算机、人工智能等相关专业