公司简介
•岗位职责
1.搭建面向类脑模型的导入/转换/推理流水线与工具链,持续打磨性能与易用性;
2.研发稀疏/事件感知的运行时与算子库,完善性能剖析与优化方法论;
3.构建多机多卡并行与资源调度能力,提升吞吐、稳定性与成本效率;
4.设计并演进中间表示(IR)与图优化/编译流程,对接硬件团队完成端到端落地部署;
5.建设平台工程能力:Profiler/Tracing/监控告警、容错与恢复、CI/CD 与质量保障;
6.面向内外部业务需求提供平台侧支撑,沉淀最佳实践与技术文档。
岗位要求
•本科及以上学历,计算机/电子/软件工程等相关专业;
•精通 C/C++ ,熟悉 Python,具备自定义算子开发与性能优化经验(CPU/CUDA/向量化/并行其一或多项);
•理解分布式训练/推理与通信库(如 NCCL 等)或有调度与资源管理实践;
•了解 MLIR/TVM/ONNX/XLA 等编译与图优化体系中的一种或多种;
•熟练使用 nsys/ncu/torch.profiler/perf 等工具进行定位与优化,具备稳定性与可观测性体系建设经验;
•具备大模型训练/推理相关开源框架贡献经验、端侧/异构/专用硬件/多芯片部署经验者加分;以上不要求全部满足,欢迎对高能效计算充满热情、学习能力强的候选人。
理工科专业优先