公司简介

“汇聚未来”云端求贤
1.负责设计和开发高性能的强化学习训练框架,支持大规模并行、分布式训练任务; 2.优化现有RL算法的执行效率,包括异步执行、批量采样、分布式推理、并行训练等; 3.与算法团队紧密合作,提供接口友好、易扩展的算法集成能力; 4.支持多种后端(如PyTorch、Megatron-LM、vLLM、SGLang)和硬件平台(GPU、国产芯片加速器); 5.参与工具链和平台建设,包括调试工具、可视化、checkpoint管理等基础设施。
计算机、人工智能、电子工程等相关专业