硬核修订分章版 · 第 09 章

第八章:监控、告警、运维、清洗与 SLA 硬核版

运维章节最怕写成‘出问题就去修’。真正的运维体系应该回答五个问题:看什么数据、怎么判异常、什么时候上门、哪些事可以预防、客户为什么愿意持续信任你。本章以监控指标、周期检查、清洗策略和工单机制为主线展开。
09当前章节
6本章小节
可跳读支持按小节快速定位
章节导语
运维章节最怕写成‘出问题就去修’。真正的运维体系应该回答五个问题:看什么数据、怎么判异常、什么时候上门、哪些事可以预防、客户为什么愿意持续信任你。本章以监控指标、周期检查、清洗策略和工单机制为主线展开。

8.1 监控不是看发了多少电,而是看系统是否偏离预期

#01

8.1 监控不是看发了多少电,而是看系统是否偏离预期

许多团队把监控平台当成给客户看的“发电数字展示板”,但 IEC 61724 的思路更接近‘性能监测与分析’。它强调的不只是采集数据,而是通过辐照、阵列输出、系统输出、温度等参数,判断系统是否按预期表现。监控的目的不是每天看一个漂亮数字,而是识别偏差。

对户用和小商用项目,虽然未必要部署大型电站级仪表,但必须形成同样的思维:至少要能比较今天、上周、上月和历史同类天气条件下的发电表现;至少要能识别离线、发电突降、逆变器反复告警、单路 MPPT 异常、通讯掉线等问题。监控如果只在客户投诉后才打开,它就不叫监控,只叫事后查看。

要把监控定义成‘发现偏差的工具’,而不是‘展示成果的页面’。这会直接影响售后团队每天看数据的方法。

【出处与参考】
  1. 国际/标准[01] IEC 61724 条目摘要:说明其目标是测量和分析 PV 系统发电表现,以评估性能质量。
  2. 国际/标准[02] IEC 61724-1 摘要说明:强调监测设备、数据质量检查和性能指标。

8.2 监控看板至少要有哪几类指标

#02

8.2 监控看板至少要有哪几类指标

对中小型屋顶项目,不需要一开始就复制电站级 SCADA,但监控看板至少应包含五类信息:可用性日/周/月发电量逆变器与 MPPT 状态告警记录通讯在线状态。如果能进一步增加历史比较和天气对照,会更有价值。

其中最容易被忽视的是可用性和通讯在线状态。很多项目客户看到监控页面有数字就以为系统没问题,但实际上系统可能已经掉线几天,只是逆变器本地还在运行;或者通讯在线,但某路 MPPT 长期异常,被累计发电量掩盖了。售后团队要学会既看总量,也看结构。

一个实用培训方法是:不要只让新人看‘今天发了几度’,而要问他‘为什么和上周同类天气不一样、哪一路变化最大、是不是监控问题还是电气问题’。会问这些问题,运维能力才开始真正形成。

指标类别最低要求为什么重要常见误判
可用性逆变器/系统在线率系统是否持续运行把掉线误认为低发电
发电量日/周/月累计看趋势与衰减只看单日不看趋势
MPPT/字符串至少看每路输入表现发现局部异常总量还行就忽略局部故障
告警保留历史告警识别重复问题告警清掉就当没发生过
通讯状态在线/离线/更新时间判断监控可靠性没数据就以为没发电

8.3 怎么判断‘发电偏低’,不要只凭感觉

#03

8.3 怎么判断‘发电偏低’,不要只凭感觉

运维中最危险的习惯,是凭肉眼和经验说‘今天好像发少了’。更好的方法,是建立一套简单偏差判断规则。PNNL 的公开运维最佳实践提到,若系统产出偏离平均太阳辐照预期区间约 ±10%,就应开始排查;同时,脏污是最常见 O&M 问题之一。发电偏低不一定是坏件,也可能是脏污、遮挡、天气偏差或通讯问题。

对中小屋顶项目,建议至少建立三个比较维度:与同月历史比较、与相邻晴天比较、与相同安装区域的相似项目比较。若三者都显示异常,再进入现场或远程诊断。这样做比‘客户一说少了就立刻上门’更节约,也更专业。

还要把脏污逻辑讲清楚。脏污损失不是永远线性,也不是越脏越容易从远处看出来。NREL/NLR 的公开研究就强调了 soiling ratio 或年化脏污损失概念,说明脏污影响需要通过数据判断,而不仅靠目测。

【偏差排查 4 步】1. 先确认监控是否在线。
2. 再比同类天气的历史发电。
3. 再查告警、MPPT、遮挡、脏污。
4. 只有远程判断不清时,再安排上门。
【出处与参考】
  1. 国际/标准[01] PNNL Solar PV O&M Best Practices:建议当产出偏离平均太阳辐照预期区间约 ±10% 时开始排查,并指出脏污是常见问题。
  2. 解读/参考[02] NLR Soiling Map:说明 Soiling Ratio / 年化脏污损失概念。

8.4 清洗不是保洁动作,而是一个成本收益决策

#04

8.4 清洗不是保洁动作,而是一个成本收益决策

客户最容易把清洗理解成‘脏了就洗’,公司也容易把清洗理解成‘上门做服务’。实际上,清洗是否值得做、多久做一次、用什么方式做,都是成本收益问题。PNNL 的公开资料指出,清洗方式和频率取决于脏污程度、系统规模、站点环境和人工/设备成本;城市与低粉尘环境和临近土路、农业区、海边环境,策略可能完全不同。

培训里不要教新人“统一每几个月洗一次”,而应教会他们判断:当前站点脏污是否足以影响收益、清洗成本是否低于预期增发收益、客户是否更在意发电还是外观。对高净值户用,清洗还可能兼具审美价值;对小商用,则更多是收益和稳定性问题。

一个成熟的售后体系,应该至少能给客户三种建议:暂不清洗、建议常规清洗、建议重点检查并清洗。这样客户感受到的是专业判断,而不是为了上门而上门。

【清洗建议的 3 档逻辑】1. 数据正常、目测轻污:暂不清洗。
2. 数据偏低且有脏污迹象:建议常规清洗。
3. 数据明显异常且伴随鸟粪、树胶、局部遮挡或安全风险:建议重点检查并清洗。
【出处与参考】
  1. 国际/标准[01] PNNL Solar PV O&M Best Practices:说明清洗频率与环境、规模和成本收益关系。
  2. 国际/标准[02] NREL Soiling R&D White Paper:讨论脏污影响与清洗系统的技术考虑。

8.5 周期检查与 IEC 62446:为什么运维要有年度体检思维

#05

8.5 周期检查与 IEC 62446:为什么运维要有年度体检思维

IEC 62446-1 的公开摘要不仅适用于初始交付,也提到其可用于后续再检和维护。对运维来说,这意味着项目不应只有‘装完测试一次’,而应有周期检查思维。至少每年或按 AC 系统要求,做一次适当的再验证,检查设备是否仍处于安全和正确运行状态。

这类周期检查对户用项目可以做轻量化版本:外观、紧固、可见线缆、逆变器告警、监控在线、发电偏差、标识和客户反馈;对小商用则应适当增加更系统的电气检查和文档更新。只要团队建立了‘年度体检’意识,很多故障都会在客户抱怨前被发现。

需要明确:维护不是修坏掉的东西,而是延长系统保持正确状态的周期。

【出处与参考】
  1. 国际/标准[01] IEC 62446-1 官方页:说明其适用于文档、调试、检查和再检。
  2. 国际/标准[02] Hioki 对 IEC 62446-1 的说明:说明可用于周期测试与 DC 侧检查。

8.6 SLA、工单与客户体验:售后真正的管理语言

#06

8.6 SLA、工单与客户体验:售后真正的管理语言

售后不是靠‘尽快处理’这种空话管理的,而是靠 SLA 和工单。所谓 SLA,不一定一开始就要非常复杂,但至少要区分响应时限和解决时限。普通咨询、监控离线、逆变器告警、停机故障和安全风险,显然不应使用同一个响应标准。

工单则是组织学习的载体。一个没有工单体系的售后团队,只会重复解决同类问题,却无法沉淀知识。反之,只要每个问题都能归类为‘用户误解、监控通讯、设备故障、安装问题、外部因素’,你很快就能知道最常见问题来自哪里,下一轮该培训谁。

【第八章落地 KPI】1. 监控在线率。
2. 月度异常识别率。
3. 首次响应时长。
4. 故障闭环时长。
5. 重复报修率。
6. 年度体检覆盖率。