2003年美國加拿大最大停電事故由軟體錯誤導致

最新消息指出,2003年8月14日發生的美國及加拿大部分地區史上最大停電事故是由軟體錯誤所導致。

  著名安全機構SecurityFocus的數據表明,位於美國俄亥俄州的第一能源(FirstEnergy)公司下屬的電力監測與控制管理系統 「XA/21」出現軟體錯誤,是北美大停電的罪魁禍首。專家對這套廣泛分布的系統的進行了持續數週的極為細緻的代碼檢查,以便找出導致錯誤的程序所在。根據第一能源公司發言人提供的數據,由於系統中重要的預警部分出現嚴重故障,負責預警服務的主伺服器與備份伺服器接連失控,使得錯誤沒有得到及時通報和處理,最終多個重要設備出現故障導致大規模停電。

  預警系統崩潰後沒有接收到更多的警報更沒法向外傳播,操作員並不知道預警系統已經失效,他們發現了部分異常情況,但因為沒有看到預警系統的警報,而不知道情況有多麼嚴重,以致一個小時後才得到控制站的指示。但此時沒完沒了的故障干擾已經讓操作員反應不過來,無法控制整個局面。正常情況下,出現錯誤的網路會立即與其他網路分隔開來,這樣一來錯誤就會被固定在一個地方,但是同樣由於預警系統失靈,操作員沒有做出應有的反應,最終使得錯誤蔓延,一發而不可收拾。

  第一能源公司目前打算將採取競標的方式來更換系統。未避免事故重現,NERC(North American Electric Reliability Council,北美電力可靠性委員會)提出了指導意見,責令第一能源公司在升級系統前為XA/21系統安裝所有補丁程序。

中關村在線 

本文留言

近期讀者推薦