公司简介

“汇聚未来”云端求贤
参与团队数据基础设施平台建设,构建新一代面向大规模模型的数据-训练-评测全链路流程,工作内容包括:
1. 构建面向多模态数据(包括文本、图像和视频)的PB级高吞吐数据处理系统;
2.构建高吞吐、低延迟的数据解码与读取加载管道,以支持多模态模型的高效大规模训练;
3.通过AI技术手段实现Data+AI的数据治理全链路,包括异构多源数据处理流水线编排、数据读取加速及管理、数据语义理解与数据融合、数据Coreset选取及合成等;
计算机、电子信息、数学等相关专业