公司简介

“汇聚未来”云端求贤
1. 【必有】:熟悉模型压缩、剪枝、蒸馏、量化等技术,有1年以上的端侧部署经验。
2. 【必有】:熟悉大模型加速技术,如kv-cache,flash-attention,tensorrt-llm等;有大模型推理加速优化经验优先。
3. 【必有】:熟悉pytorch、TensorFlow等AI框架,了解TensorRT、TVM。
4. 【必有】:熟悉CUDA编程和insight system,有利用GPU等异构硬件上优化软件性能的优势。
5. 自我驱动力强,优秀的分析问题和解决问题的能力,对新技术有钻研兴趣,自学能力强。
计算机、人工智能等相关专业