“汇聚未来”云端求贤 · 上海智往蔚蓝科技有限公司

VLA-模型量化部署工程师

薪资面议  /  全国

今天 18:59 更新

我要推荐 内部推荐

若你发现本职位存在违规现象,欢迎举报。

提交成功

3s后自动关闭

举报职位

职位属性

  • 招聘类型:校招
  • 工作性质:全职

职位描述

1. 【必有】:熟悉模型压缩、剪枝、蒸馏、量化等技术,有1年以上的端侧部署经验。

2. 【必有】:熟悉大模型加速技术,如kv-cache,flash-attention,tensorrt-llm等;有大模型推理加速优化经验优先。

3. 【必有】:熟悉pytorch、TensorFlow等AI框架,了解TensorRT、TVM。

4. 【必有】:熟悉CUDA编程和insight system,有利用GPU等异构硬件上优化软件性能的优势。

5. 自我驱动力强,优秀的分析问题和解决问题的能力,对新技术有钻研兴趣,自学能力强。

任职条件

计算机、人工智能等相关专业

职位要求

  • 学历要求:博士