公司简介

职位描述
1. 探索LLM前沿领域研究,包括但不限于数据建设、逻辑推理、智能体、MoE、Scaling law和模型评估等工作;
2. 负责优化和提升LLM对齐效果,包括数据质量优化、指令微调、奖励模型优化、强化学习(RL)策略迭代等,持续提高算法的效率和性能;
3. 协助团队进行大模型相关技术的研究和创新,跟踪领域内的最新进展,开展相关的实验和验证工作,为团队的技术发展提供有价值的见解和建议;
4. 参与撰写技术文档、研究报告和学术论文,记录项目过程和成果,与团队成员分享经验和知识。
职位要求
职位要求
1. 2026届及之后毕业的同学优先,计算机科学、人工智能、数学等相关专业优先;
2. 熟悉Python、Java等至少一种编程语言与深度学习框架,具有良好的编程能力和扎实的数学理论基础;
3. 具备一定的NLP经验,熟悉BERT、GPT等模型,参与过NLP中分类、NER、文本生成、文本匹配等子任务的效果优化工作,能够根据实际问题改造和优化算法;
4. 具有强化学习(RL)、逻辑推理或智能体(Agent)相关研究或项目经验者优先;
5. 关注行业前沿进展,对技术开发及应用有热情,乐于挑战自我并具备创新思维;
6. 良好的沟通能力、跨团队协作能力,出色的规划与执行力,强烈的责任感,优秀的学习能力和自我驱动力;
7. 有竞赛经历和论文成果者优先。
人工智能、计算机、软件