數據中心機房供電保障設備中,UPS、HVDC、發電機組等設備均在不同等級的機房廣泛應用;UPS、HVDC 電源系統因常年處于運行狀态,會出現一些故障;而在線式 UPS 電源因設計電路合理,驅動功率元件容量所取的餘量較大,相對來說電源電路故障率較低,而由電池引起的故障率較高。正确的使用和維護好UPS 電池的壽命是降低不間斷電源故障率的關鍵因素。同時還要防範因 UPS 内部控制(接線、軟件等) 系統引起的異常停機事故!
下面是一個 UPS 因控制系統異常導緻的停機事件,分享一下,希望引起各位運維同行的重視。
故障現象:
電力監控系統突然報出多條告警信息:UPS 異常、UPS 輸出屏失電(電壓、電流同時歸 0)、機房 N 個列頭櫃失電、UPS 系統 BCB 電池開關跳位等;
現場狀況:
值班人員立即到場檢查報警UPS,現場狀态如下:
1、現場 UPS 輸入櫃主路、旁路電源開關狀态無異常;
2、輸出櫃各開關處于合閘位置,輸出櫃失電;
3、輸出櫃各開關對應機房列頭櫃失電;
4、報警 UPS 對應蓄電池組開關處于跳閘位置;重合無法合閘;
5、UPS 本體各狀态指示燈熄滅,報警燈常亮,同時伴有報警聲;
應急措施:
1、立即對UPS 電源各開關狀态及電量各參數進行檢查, 電源櫃三相電源電壓無異常,主路、旁路開關均處于合閘位置,電流為 0;将 UPS 輸出屏主進開關分閘;
2、按 UPS 本體故障清除鍵按鈕;
3、将UPS 輸入主、旁路斷路器分閘,靜待 30 秒後恢複合閘;此時 UPS 自動轉為旁路運行狀态;
4、将 UPS 運行狀态由旁路供電模式轉換為正常整流逆變模式;檢查 UPS 輸出各項電量參數無異常;此時再将電池組開關由跳位分閘到分位,然後重新進行合閘,開關恢複正常合閘位置;
5、将 UPS 輸出屏各開關恢複合閘位置,機房失電列頭櫃恢複供電;
6、通知 UPS 廠家人員到場對故障設備進行檢查,排除故障隐患;
故障原因排查:
UPS 廠家維護工程師到達現場,對 UPS 内部數據導出檢查;發現在本 UPS 故障時,UPS 本機發出了緊急停機指令,導緻 UPS 停機。随後對 UPS 本體仔細檢查,發現 EPO 連線插頭未插實!無其他異常現象。
結合現場實際情況:
1、UPS 電源櫃主、旁路開關狀态正常,輸出中斷,BCB 電池組開關跳閘,無法手動恢複合閘狀态;
2、UPS 設備本體主、旁路輸入回路鎖死;
3、UPS 設備市電輸入主、旁路分(UPS 本體斷電)合閘後,UPS 自動恢複旁路運行模式;
4、手動啟動逆變器,UPS 切換至主路逆變供電狀态;
5、合 BCB 電池開關操作成功。
以上現象符合EPO 動作後緊急停機特征,故本次故障可判定為UPS 因内部錯誤指令導緻停機故障。
後續改進措施:
UPS 是設備是供電可靠性的最後一道保障,為保障數據中心供電安全可靠,維護團隊舉一反三,防止類似問題再次發生。
立即對所有 UPS 運行安全隐患進行檢查:全面檢查UPS 運行環境,檢查風扇運行情況,确保 UPS 散熱條件滿足要求; 檢查 UPS 電池運行狀态,确保電池具有後備保障能力;檢查各 UPS 的内部EPO 接線情況,防止類似故障再次發生。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!