公司简介
“汇聚未来”云端求贤
1、参与大模型前沿架构研究、算法验证、工程实现的全流程。
2、参与大模型学习与训练范式、特别是大规模预训练范式的算法验证、工程实现。
3、调优前沿架构的算法细节,优化突破Transformer、涉及多种模态的新架构模型的工程实现。
4、开发适用于架构与训练范式高效算法验证的工具链和内部算法库。
岗位要求
1、硕士及以上学历,计算机或人工智能相关专业优先,有顶会论文可加分。
2、熟悉主流大模型的部署、训练、架构实现,有大规模训练和部署经验者优先。
3、熟悉模型架构和训练范式研发工作者优先。
4、熟悉deepspeed、xtuner、llamafactory、megatron、vllm、sglang、lmdeploy、opencompass等大模型训练、推理、训练框架可加分。
5、具备良好的沟通表达能力、团队协作意识、针对关键技术难度的攻坚能力以及一定的抗压能力。
理工科专业优先