公司简介
1、数据炼丹术: 你将成为模型知识的源头活水。调配预训练数据配比、打磨学习策略,持续拓宽模型的知识边界,深入专业领域,挖掘并淬炼高质量数据,让模型从通才蜕变为专家。与其他团队无缝协作,精准注入推理、代码、Agent 等核心能力养料,助力后训练高效运行。
2、模型能力度量衡: 你将打造最精准的标尺,度量模型的真实能力。打破传统 benchmark 的局限,构建更科学、更全面的评估体系,从“标准考试”走向“实战考验”。探索创新的评估维度与方法,不仅为模型能力画出精准的雷达图,更要提供一份直指核心的深度诊断报告。
3、算法与工程的交响: 你将与顶尖工程团队并肩作战,共同设计优雅且高效的架构,例如优化 MoE 模型结构,让每一份算力都发挥最大价值。探索 KV cache 压缩等方案,挑战推理速度极限,让模型疾速如风。
4、未来技术布道者: 你的目光将投向远方,探索无限可能。紧跟学术前沿,探索如 Latent Reasoning、Test-Time Training 等极具潜力的方向。你的任务不只是实验,更是推动这些前瞻技术在超大规模模型上落地生根,为下一代AI的诞生奠定基石。
1、预计毕业时间介于2025年9月至2026年8月的国内外计算机、数学、人工智能等相关专业的博士或优秀研究生;
2、有独立研究能力,曾发表机器学习或相关领域的一作论文;
3、具备扎实的编程基础和优秀的工程能力,能够独立实现相关算法和实验;
4、具有大模型领域的实习或科研经验者优先;
5、具备良好的团队协作能力和沟通能力。