公司简介
1.评测框架开发:参与大模型自动化评测框架的设计、开发与维护,持续提升评测流程的稳定性、可扩展性和执行效率;
2.新指标接入:跟进学术界与工业界最新的大模型评测基准Benchmark),负责将其快速、准确地集成到现有评测平台中;
3.数据处理与分析:负责评测数据集的管理,对海量评测结果进行统计分析、深度挖掘和可视化呈现,为模型优化提供数据洞见;
4.评测报告撰写:协助团队完成多维度、多场景下的模型能力评测,并参与撰写发版模型技术报告。
1.编程能力:具备扎实的 Python 编程功底,熟悉常用的数据结构与算法,代码风格良好,追求高质量的代码实现。
2.学历背景:计算机科学、软件工程、人工智能、电子信息等相关专业在读本科或研究生。
3.实习时间:能保证连续实习 3个月及以上,每周出勤不少于4天。
4.基础素质:具备优秀的逻辑思维能力、快速学习能力和解决问题的能力,以及良好的沟通和团队协作精神。
【加分项】
1.竞赛经历:在 ACM/ICPC、高中信息学奥林匹克竞赛(OI,CSP)等编程竞赛中获得过优异成绩者优先。
2.大模型基础:对大语言模型(LLM)有基本了解,熟悉 Transformer 原理、Prompt Engineering 等相关概念者优先。
3.数理基础:修读过概率论、数理统计、线性代数等课程,具备良好的数学功底。
4.工程经验:熟悉 Git 版本控制工具,有个人项目或开源社区贡献经验者优先。