远景科技集团 

主任工程师-运维值班经理

薪资面议  /  乌兰察布

今天 17:27 更新

我要推荐 内部推荐

若你发现本职位存在违规现象,欢迎举报。

提交成功

3s后自动关闭

举报职位

职位属性

  • 招聘类型:社招
  • 工作性质:全职

职位描述

一、核心职责:全天候运营管理与应急统筹

1. 值班体系建设与流程管控

---统筹园区数据中心 7×24 小时值班体系,制定并优化值班排班计划(含节假日备岗方案),确保各专业(电气、暖通、弱电、消防)值班力量均衡配置,值班记录完整率 100%;

---统筹园区值班和维护团队资质,确保特性工作下的资质合规;

---主导日常巡检标准化管理,监督一线运维按 SOP 完成设备巡检(如每小时动环数据抄录、每日基础设施运行状态汇总),对巡检异常问题(如设备温度超限、报警信号误触发)启动分级响应机制;

2. 跨专业协同与应急指挥

---作为现场值班最高负责人,实时协调处理多专业联动故障(如市电中断时同步启动发电机与空调冷机应急模式),快速整合电气、暖通、弱电等二线技术资源,确保应急响应时间≤5 分钟;

---主导园区级突发事件(如极端天气导致外市电波动、施工误操作引发局部断电)的现场指挥,严格按应急预案调度人员、物资,督促记录事件处理全流程并审核一线值班复盘报告;

3. 数据监测与决策支持

---监控动环监控平台、安防系统、能耗管理平台实时数据,建立关键指标(如 PUE、负载率、设备运行时长)动态预警模型,针对异常趋势(如冷却系统能耗突增)提前协调二线工程师介入分析;

---每日汇总值班日志、故障报表、能耗数据,形成《园区运行日报》报送管理层,为基础设施容量规划、节能改造提供数据支撑;

4. 合规性与安全管理

---监督值班期间安全制度执行(如出入机房登记、动火作业审批、有限空间作业监护),每周组织值班区域安全自查(如消防通道畅通性、应急照明有效性),确保符合 GB 50174 数据中心设计规范及 Uptime 安全要求,负责对一线值班团队的检查;

---对接园区物业、安保团队,协调处理值班期间外部事务(如政府部门临时检查、厂商现场服务接待),确保信息传递准确高效;

二、团队协作与管理职责

1. 一线团队管理与赋能

---负责值班团队日常管理(含考勤、绩效复评),制定针对性培训计划(如每月 1 次应急流程推演、每季度 1 次跨专业基础知识培训),提升一线运维故障预判与基础处置能力;

---制定一线值班团队技能标准,协调外部培训力量;

---制定全岗位技能矩阵,统筹内部培训与外部认证资源,搭建运维人才梯队;

---负责对园区ECC的直接管理;

---对接外部人力供应商;

---建立 “值班问题闭环管理机制”,跟踪设备报修、工单处理进度,对重复发生问题(如某区域门禁频繁误报)推动二线工程师制定根治方案,避免问题升级;

2. 跨部门协作与资源整合

---与二线技术团队(电气、暖通、弱电、消防)建立 24 小时沟通通道,精准传递故障现象与现场信息,协调技术资源远程支持或赶赴现场;与数据中心客户服务团队对接,及时反馈客户关注的运行状态(如预定停机维护进展);

---主导值班相关流程优化(如巡检路线规划、应急物资储备清单修订),结合现场实操经验提出系统性改进建议;

任职条件

一、专业背景与经验

1. 学历与专业

---本科及以上学历,工程管理、机电一体化、制冷专业、计算机网络等相关专业,具备数据中心基础设施多专业协同运行基础知识;

2. 行业经验

---8年以上大型数据中心 / 工业园区值班管理经验,至少 3 年值班经理岗位经历,带过不低于40人的值班团队,熟悉数据中心 Tier III/Tier IV 等级运行保障要求;

---有北方寒冷地区项目值班经验者优先,具备低温环境下 24 小时连续值班管理、跨专业应急协调的实战经验;

二、核心技能与能力

1. 管理与协调能力

---精通数据中心值班体系搭建与流程设计,能快速识别多专业系统联动风险(如消防报警触发时的供电切换逻辑漏洞),具备同时调度 5 个以上协作团队的现场指挥能力;

---熟练使用值班管理工具(如 DCIM系统、动环监控平台、电子巡检系统),掌握 Excel 数据可视化技巧(如制作值班数据趋势图、故障分布热力图);

2. 跨专业知识储备

---熟悉电气供配电、暖通制冷、弱电安防、消防系统的基本架构与联动逻辑,能看懂各专业系统原理图及关键设备参数(如 UPS 容量、冷水机组 COP 值、消防分区划分);

3. 资质证书

---必备:高压电工操作证、低压电工操作证、制冷证;

优先:PMP 项目管理认证、ISO 20000/27001 体系认证、厂家综合运维管理培训证书、安全生产管理人员证书(C 证)、数据中心运维相关培训认证(如 Uptime O&M 基础认证);

三、职业素养与软技能

1. 抗压与应急决策

---能适应高强度值班节奏,在夜间 / 节假日突发故障时保持清晰决策(如快速判断是否触发应急预案升级),过往项目中无因值班管理失误导致的事故扩大化记录;

2. 沟通与细节把控

---可准确向技术团队描述故障现象(如 “3 号机房精密空调报高压报警,现场压力值 18bar”),向非技术人员解释专业术语(如 “市电切换时为何产生 3 秒照明闪烁”);

3. 持续改进意识

---主动收集值班过程中的痛点(如巡检系统操作繁琐、应急物资取用不便),推动建立 “值班优化建议库”,定期跟踪改进措施落地效果(如引入智能巡检机器人减少人工负荷);