公司简介

"科技成就生活之美"
"科技成就生活之美"
岗位目标
负责自动驾驶领域数据的清洗、处理和预处理工作,推动数据的高效、精准标注/生产,构建支持模型训练、仿真测试和数据闭环的自动标注体系,提升自动驾驶数据处理效率与算法迭代速度。
职责:
•结合自动驾驶业务需求,设计数据的清洗、处理和预处理工作,确保数据质量和一致性;
•与算法团队协作,设计规则驱动(Rule-based)与深度学习驱动(ML/DL-based)相结合的数据预处理方案,提升标注精度与效率。
•与团队一起开发、优化和维护数据分析流程,帮助实现数据驱动决策;
•协助进行机器学习模型的训练和推理,提供AI支持;
•在Docker环境中部署和管理数据处理工具及模型;
•编写文档,支持团队的日常工作和数据报告。
•支持主动学习与数据再标注策略,自动发现模型薄弱区域,提升自动标注数据对算法性能的正向驱动。
•支持数据标注流水线(Data Pipeline)的建设与优化,提升数据流转、任务调度、标注回流的性能与稳定性。
•关注行业前沿技术与开源社区,推动自动标注领域的技术创新与最佳实践
•计算机科学、人工智能、软件工程、自动化、电子信息等相关专业本科及以上学历,硕士优先。
•5年以上数据自动标注、数据平台、深度学习算法相关经验,具有自动驾驶、智能驾驶或AI领域背景者优先。
•熟悉自动标注架构与深度学习模型,具备2D/3D自动标注解决方案设计与实施经验。
•精通数据处理与计算框架,包括但不限于Spark、Flink、Kafka,有分布式计算与大规模数据管道设计经验。
•熟悉多模态传感器数据特性,具备图像、点云、时间序列等复杂数据的自动标注经验。
•具备扎实的编程能力,熟练使用Python、C++、Java,具备高度复杂系统的设计与实现能力。
•具备MLOps思维,熟悉模型训练、自动标注、数据回流全链路自动化解决方案。
•了解容器与微服务架构(Docker、Kubernetes),具有CI/CD能力,能实现自动化任务部署与迭代。
•具备系统化架构思维,能够解决复杂数据标注系统的设计与实施难题。
•跨团队协作与沟通能力强,能够与算法、工程、产品团队协同,推动自动标注系统落地。
•具备数据驱动决策能力,能持续优化数据标注效率与质量,推动自动驾驶数据闭环进步。