“汇聚未来”云端求贤 · 中国电信股份有限公司人工智能研究院(上海)

端侧模型训练算法研究员/研究工程师

薪资面议  /  上海

今天 18:59 更新

我要推荐 内部推荐

若你发现本职位存在违规现象,欢迎举报。

提交成功

3s后自动关闭

举报职位

职位属性

  • 招聘类型:校招
  • 工作性质:全职

职位描述

1. 前沿算法研究与探索

- 深入研究和跟踪大模型预训练领域的最新算法和技术动态,包括但不限于Transformer架构的改进、自监督学习方法的创新、多模态融合技术等,及时将前沿研究成果引入到团队的项目中。

- 针对大模型的性能瓶颈和挑战,如计算效率、内存占用、模型泛化能力等,开展创新性的算法研究,提出有效的解决方案并进行理论验证和实验评估。

2. 训练模型架构设计与优化

- 参与大模型预训练架构的设计和开发工作,负责设计高效、可扩展的模型结构,以适应大规模数据和复杂任务的需求。

- 对现有预训练模型架构进行深入分析和优化,通过改进模型的编码器、解码器、注意力机制等关键模块,提高模型的性能和效率。

- 研究和应用模型压缩技术,如量化、剪枝、知识蒸馏等,以降低大模型的存储和计算成本,使其能够更好地部署在实际应用环境中。

3. 模型训练与评估

- 设计和实现高效的模型训练算法,包括分布式训练、混合精度训练等,以加速大模型的训练过程并提高训练的稳定性。

- 构建合理的模型评估体系,从多个角度对预训练模型的性能进行评估,如准确性、鲁棒性、泛化能力等,并根据评估结果对模型进行持续优化。

- 进行模型的微调和迁移学习研究,探索如何在不同的下游任务上快速、有效地调整预训练模型,以实现更好的性能表现。

任职条件

计算机科学、人工智能、数学、统计学等相关专业

职位要求

  • 学历要求:硕士