公司简介

作为算法工程师,负责公司大模型相关产品的研发和应用。开发的算法与平台,主要面向金融、能源等企业客户,满足客户对数智化不断增长的需求,加速AI从实验室到商业场景中的快速落地和持续提升,实现算法对数据和业务的赋能,并完成AI X Data的闭环。
工作职责:
1、参与知识工程、低资源建模、多模态模型、多智能体等研发工作,优化(多模态)大模型语料处理、训练训练、推理部署优化加速、模型评估中算法和算法工程问题;
2、参与实际业务项目,承担(多模态)大模型在金融/医疗/工业/具身等领域项目的落地应用开发工作;
3、关注前沿算法和数据技术,参与大模型和智能体领域中部分挑战性课题的研发。
工作要求:
1、计算机、软件工程类,电子通信类,数学物理等理工类专业,硕士及以上学历;
2、熟悉深度学习理论和算法,掌握大模型的基础理论,具备大模型训练经验(如SFT、DPO、PPO、RLHF等),能够基于开源框架完成大模型迭代训练;
3、编码能力强,熟练掌握Python或C/C++,熟悉至少一种主流深度学习框架;
4、良好的沟通能力和团队协作精神,对前沿技术有热情,出色的问题解决能力和创新思维,能够将AI技术应用于解决实际场景项目;
5、在大模型、自然语言处理、计算机视觉领域有大影响力项目/优秀论文者优先。
计算机相关专业