(浙江浙能鎮(zhèn)海發(fā)電有限責(zé)任公司,浙江 寧波 315208) 崔振武,丁永君
崔振武(1967-)男,浙江寧波人,技師,從事熱工自動化工作。
摘要:本文對鎮(zhèn)海電廠分散控制系統(tǒng)(簡稱DCS)運行中發(fā)生的DCS軟、硬件故障進(jìn)行了歸類分析,交流了這些故障的處理方法。為減少因控制系統(tǒng)故障引起的機組跳閘次數(shù),本文從提高熱工自動化系統(tǒng)的可靠性著手,提出了一些防范措施,供同行參考。
關(guān)鍵詞:DCS;故障;分析;技術(shù)措施
Abstract: The paper analyzes in detail the failures which have occurred in the DCS of Zhenhai Power Plant, which mainly includes the primary controller and module failures, server failures, network failures of software control and other factors, and present the treatment options to the failures. For reliability of the DCS, we also give some technical measures to prevent similar accidents.
Key words: DCS; fault; analysis; technical measures
1 概述
鎮(zhèn)海電廠#3~#6 215MW機組從1998年開始進(jìn)行自動化改造,選用國產(chǎn)的DCS系統(tǒng),2007年起各臺機組陸續(xù)進(jìn)行升級改造,目前已完成三臺機組的升級工作。鎮(zhèn)海電廠DCS的網(wǎng)絡(luò)結(jié)構(gòu)由上到下分為監(jiān)控網(wǎng)絡(luò)、系統(tǒng)網(wǎng)絡(luò)和控制網(wǎng)絡(luò)三個層次,如圖1所示。其中監(jiān)控網(wǎng)絡(luò)中的工程師站、操作員站、高級計算站等和系統(tǒng)網(wǎng)絡(luò)中的現(xiàn)場控制站通過系統(tǒng)服務(wù)器實現(xiàn)互連;控制網(wǎng)絡(luò)由Prof iBus-DP構(gòu)成,實現(xiàn)現(xiàn)場控制站與過程I/O單元的通訊。該系統(tǒng)可由多組服務(wù)器組成,由此可將系統(tǒng)劃分為多個域。鎮(zhèn)海電廠215MW機組的DCS均劃分為兩個域,即主機域和輔機域。每個域由獨立的服務(wù)器、系統(tǒng)網(wǎng)絡(luò)和多個現(xiàn)場控制站組成,域內(nèi)的數(shù)據(jù)單獨組態(tài)和管理,完成相對獨立的采集和控制功能;兩個域共享監(jiān)控網(wǎng)絡(luò)和工程師站,操作員站等則通過域名登錄到不同的域進(jìn)行操作。
圖1 鎮(zhèn)電DCS網(wǎng)絡(luò)結(jié)構(gòu)圖
鎮(zhèn)海電廠DCS系統(tǒng)在升級改造前故障率相對較高,經(jīng)過對歷年來故障統(tǒng)計的分析,主要故障有主控制器故障、I/O模件故障、服務(wù)器故障、控制網(wǎng)絡(luò)故障和其它因素等引起,以2006年度為例,#3~#6機組共發(fā)生DCS相關(guān)故障39起,其中主控制器故障13起,模件故障8起,占故障總數(shù)的53.8%,因此控制系統(tǒng)故障是熱工系統(tǒng)故障的主要因素,其分類統(tǒng)計情況,如圖2所示。
圖2 控制系統(tǒng)故障的分類統(tǒng)計情況
2 DCS故障現(xiàn)象及其分析
根據(jù)上述DCS系統(tǒng)所發(fā)生的主要故障發(fā)生類型,下面對鎮(zhèn)海電廠近年來應(yīng)用DCS過程中比較典型的軟、硬件故障進(jìn)行分析。
2.1 主控制器故障
主控制器故障在鎮(zhèn)海電廠DCS故障中占有較大比例,而且引起主控制器故障的原因也各不相同,部分故障在單純復(fù)位或重新啟動后能夠恢復(fù)正常,部分故障則對機組運行產(chǎn)生了嚴(yán)重影響。
(1)異常控制器不能自動切換
2009年8月31日,現(xiàn)場檢查時發(fā)現(xiàn)#5機#11I/O站和#26I/O站主控器故障,均為A主控故障燈閃亮,雙機冗余通訊燈不亮,B主控備用。從工程師站上查看,主控制器顯示A主控為主,B主控備用,狀態(tài)顯示正常;查閱DCS歷史記錄,無相關(guān)故障記錄;相關(guān)I/O站內(nèi)各參數(shù)采集、控制設(shè)備動作均正常。經(jīng)分析,認(rèn)為主控制器當(dāng)前仍正常運行,但雙機冗余的同步性存在問題,如果這時發(fā)生主控切換將會出現(xiàn)較大擾動。而在這之前異常控制器不能冗余切換故障已發(fā)生過多次,如#3爐DCS系統(tǒng)曾發(fā)生一次風(fēng)壓自動調(diào)節(jié)偏差大于360Pa時,運行人員手動干預(yù)操作送風(fēng)機勺管調(diào)節(jié)執(zhí)行機構(gòu)無效,急忙至就地進(jìn)行手操。熱工通過工程師站,檢查對應(yīng)的#12I/O站,發(fā)現(xiàn)A主控離線,B主控備用,在I/O站上查看A主控系統(tǒng)燈1和系統(tǒng)燈2均不亮,故障燈未亮,表明該主控已失去與系統(tǒng)網(wǎng)的數(shù)據(jù)交流,但主控未實現(xiàn)冗余切換。另#3爐#23I/O站也曾發(fā)生過A主控故障離線,故障燈與雙機冗余數(shù)據(jù)交換燈均不亮,主控制器未自動切換。這些故障案例表明,MACS系統(tǒng)主控制器冗余切換功能不完善,某種故障狀態(tài)下該功能失效。
(2)散熱風(fēng)扇故障導(dǎo)致主控制器故障
主控制器內(nèi)的散熱風(fēng)扇如果故障,將使主控制器故障率大大增加。自2005年以來,鎮(zhèn)海電廠統(tǒng)計的因主控制器內(nèi)散熱風(fēng)扇異常導(dǎo)致的主控制器故障共計13次(這類故障的主控制器內(nèi)散熱風(fēng)扇均有一個或幾個運轉(zhuǎn)不正常或完全不運轉(zhuǎn),一般在更換散熱風(fēng)扇后仍能恢復(fù)正常運行)。
(3)電子室環(huán)境對主控制器的影響
電子室內(nèi)的溫、濕度對主控制器有一定影響,特別對于需要強制散熱的主控制器影響更大。溫、濕度過高不一定使主控制器立即發(fā)生故障,但長期處于這種環(huán)境下必定會使主控制器故障率增高,而且從我們的統(tǒng)計來看,濕度的影響比溫度的影響更大。
根據(jù)2005年以來的統(tǒng)計,每年3~6月份的主控制器故障次數(shù)約占到全年總數(shù)的1/3到一半多,這段時期正值南方濕熱的雨季,中央空調(diào)往往會補充大量的新風(fēng),電子室內(nèi)濕度會有所增大。這種情況下發(fā)生的主控制器異常,一般均通過復(fù)位或重新啟動后可以恢復(fù),只有個別需要更換新的主控制器。
2.2 模件故障
與主控制器故障相比,模件故障相對容易解決,一般通過模件復(fù)位和更換模件就能恢復(fù)正常。但有些故障由于受其它因素影響,比較特別。
(1)外部干擾引起I/O模件離線
2007年1月,#5機組按計劃轉(zhuǎn)入小修。停機過程中,運行人員投微油點火裝置助燃,不久發(fā)生用于微油燃燒器壁溫測量的熱電偶測量模件故障,微油燃燒器壁溫顯示無效。熱工人員對模件復(fù)位后恢復(fù)正常。之后在小修和開機過程中多次發(fā)生該模件故障,均能夠通過復(fù)位得以解決,期間也更換過模件,但故障依舊。機組復(fù)役后該模件運行穩(wěn)定,直至3月4日再次發(fā)生該模件故障。經(jīng)現(xiàn)場檢查,接入該模件的二支熱電偶元件安裝位置與微油點火槍距離過近,當(dāng)微油點火槍點火時高能電磁干擾通過電纜串入模件中,造成模件離線,并在試驗后得到確認(rèn)。在調(diào)整熱電偶與點火槍的安裝位置后,此故障排除。
(2)單一通道的故障
模件故障有硬性和軟性二種,需通過更換模件來解決的我們稱之為硬性故障,而通過對模件進(jìn)行復(fù)位可以解決的故障,我們稱之為軟故障,這種故障也有可能只反映在其中的某一個通道上,可以通過實際測量來判定。如2007年1月15日,#5機化補水調(diào)節(jié)閥不能開啟,無論DCS中給出的指令是多少,現(xiàn)場測量電流值始終為4mA。之后對該模件進(jìn)行復(fù)位后控制恢復(fù)正常。另有一次#4爐定排疏水電動門開啟且無法關(guān)閉。現(xiàn)場檢查對應(yīng)的開關(guān)量輸出模件,第一通道輸出為“1”(對應(yīng)該電動門的開指令),而DCS中查看該通道的狀態(tài)為“0”,更換模件無效,對主控制器進(jìn)行下裝后控制恢復(fù)正常。
2.3 服務(wù)器故障
鎮(zhèn)海電廠DCS的監(jiān)控網(wǎng)絡(luò)和系統(tǒng)網(wǎng)絡(luò)通過服務(wù)器實現(xiàn)互連,因此服務(wù)器故障將使處在上層監(jiān)控網(wǎng)絡(luò)操作員站失去對下層系統(tǒng)網(wǎng)絡(luò)中的運行參數(shù)和控制設(shè)備的監(jiān)視和控制,給機組的安全穩(wěn)定運行造成嚴(yán)重的影響。2007年6月11日,#6機主機域主服務(wù)器故障,服務(wù)器未能自動切換,所有操作站上參數(shù)失效,控制失靈,運行人員依靠DEH和后備儀表維持機組運行。熱工人員在手動切換到B服務(wù)器后DCS恢復(fù)運行,但從系統(tǒng)狀態(tài)圖中查看A服務(wù)器連接系統(tǒng)網(wǎng)的下層網(wǎng)絡(luò)仍然處于故障狀態(tài),本地網(wǎng)絡(luò)沒有連接,重新啟動服務(wù)器后網(wǎng)絡(luò)連接恢復(fù)。之后#6機又多次發(fā)生同類故障,檢查服務(wù)器主機及網(wǎng)卡均未發(fā)現(xiàn)異常,也更換過服務(wù)器,但至今原因不明。目前采取定期切換、重啟服務(wù)器的方法,有一定效果。
2.4 控制網(wǎng)絡(luò)故障
一般來說,DCS網(wǎng)絡(luò)故障多發(fā)生在網(wǎng)絡(luò)設(shè)備如交換機、光端機的故障,往往在更換硬件后故障現(xiàn)象能得到解決。2007年1月29日,#3機一臺交換機故障導(dǎo)致監(jiān)控網(wǎng)B網(wǎng)離線;之前#3機一臺交換機死機,導(dǎo)致系統(tǒng)網(wǎng)A網(wǎng)離線; #5機一臺光端機故障,導(dǎo)致#30站遠(yuǎn)程I/O站離線;這些故障均在復(fù)位或更換網(wǎng)絡(luò)設(shè)備后恢復(fù)正常。
由于DCS的控制網(wǎng)絡(luò)連接主控制器和過程I/O模件,控制網(wǎng)絡(luò)故障對系統(tǒng)的影響范圍較大,往往是一段鏈路中的多個模件同時離線,其原因具有多樣性:
(1)網(wǎng)線連接配件故障
2007年2月5日,#3機組正常運行,#20I/O站內(nèi)多個參數(shù)顯示無效,控制設(shè)備操作失靈。現(xiàn)場檢查,#20I/O站A主控運行,B主控備用,A列模件運行正常,B列、C列模件均離線。在做好必要的安全措施后切換主控制器,則B列、C列模件大部分恢復(fù)運行,個別仍有間歇性離線,而A列模件則都出現(xiàn)間歇性離線,間隔時間在幾秒到幾分鐘不等。查明的原因是B主控控制網(wǎng)的DP線插頭故障(DP插頭內(nèi)部配有終端電阻,是否使用可選擇),導(dǎo)致鏈路中斷或阻抗不匹配,更換DP插頭后恢復(fù)正常。之后類似故障#3機還發(fā)生過兩次,均在更換DP頭后得以恢復(fù),于是在機組檢修期間,我們對所有同類型的DP插頭進(jìn)行了更換。
(2)DP總線“虛接”
鎮(zhèn)海電廠DCS遠(yuǎn)程I/O站的控制網(wǎng)絡(luò)采用底座串接的方式擴(kuò)展I/O模塊,這種連接方式靈活度高,便于分散連接,但同時存在DP通信的故障點多,通信總線的特性阻抗不穩(wěn)定等缺點。
2006年4月,#4機組發(fā)電機溫度測量遠(yuǎn)程柜自第二個模塊以下全部離線,在按壓或觸碰這幾個模件后則能夠恢復(fù),之后多次發(fā)生類似故障,基本以同樣方式解決。經(jīng)分析,這類故障原因是因為垂直安裝的模塊底座受機械振動引起觸點松動和現(xiàn)場環(huán)境不佳如濕熱等將引起觸點氧化,會造成DP總線的“虛接”,特性阻抗不匹配。這類故障在安裝于現(xiàn)場的遠(yuǎn)程I/O柜發(fā)生較多,而安裝于電子室內(nèi)的I/O站則基本未發(fā)生。#4機發(fā)電機溫度柜在機組檢修時更換了所有底座并重新安裝后,這類情況有了較大好轉(zhuǎn)。
(3)故障模件對DP總線的影響
一段DP總線上幾個模件的通訊接口故障時,可能會引起一段DP鏈路上的所有模塊離線。如#4機給泵溫度遠(yuǎn)程I/O柜內(nèi)曾發(fā)生多個模件頻繁離線,離線間隔時間短則幾秒鐘,長則幾分鐘甚至更長,DP總線無虛接現(xiàn)象。采取下裝主控、更換模件等手段均無效。在插拔模件的過程中,當(dāng)拔到某一個模件則DP鏈路恢復(fù)正常,再插回則又有模件開始離線,因此判斷是模件故障引起整個一段DP鏈路上模件離線。通過逐一排除的方法共查到有一塊模件故障,事后拆開模件肉眼能看到有電容元件不同程度爆裂的跡象。
模件故障影響一段DP總線上模件離線的故障點較難判斷,離線的不一定是故障模件,故障模件也不一定會離線,但沒有好的測試手段,只能用逐一排除法來進(jìn)行故障點的判斷,在機組運行時有一定的難度和風(fēng)險。但這種總線故障在只有一個模件故障時不會出現(xiàn),而且模件內(nèi)的故障點能用肉眼觀察到,因此機組檢修時可以對模件拆開檢查,能起到很好的預(yù)防效果。
2.5 其它因素引起的故障
(1)GPS時鐘對DCS的影響
鎮(zhèn)海電廠DCS的系統(tǒng)時鐘是由服務(wù)器通過與GPS電子鐘通訊進(jìn)行校時的。2006年9月17日,#4機組正常運行時發(fā)生DCS操作員站均離線退出運行,主機域和輔機域兩個冗余服務(wù)器中的主服務(wù)器均離線退出運行,工程師站離線退出運行,主機域和輔機域的冗余服務(wù)器自動切換成功。正在現(xiàn)場的熱工人員立即啟動工程師站,運行人員通過工程師站維持機組運行。經(jīng)現(xiàn)場分析,由于GPS電子鐘故障,DCS系統(tǒng)時鐘被錯誤地校成了2178年,而因此造成操作員站離線則應(yīng)是系統(tǒng)程序的bug。在恢復(fù)系統(tǒng)時鐘后,逐一啟動操作員站和服務(wù)器,DCS恢復(fù)正常運行。
(2)控制系統(tǒng)邏輯不完善
控制邏輯組態(tài)的不完善,很難通過正常的試驗發(fā)現(xiàn),正常運行中也不會有問題,但在某種特定條件下會影響到機組安全穩(wěn)定運行,甚至聯(lián)鎖保護(hù)誤動。如#5機組215MW滿負(fù)荷運行,甲給水泵運行,乙給水泵備用時,甲泵前置泵流量超限報警(超量程上限800t/h),隨后甲泵再循環(huán)調(diào)節(jié)閥自動開啟,給泵出口壓力低報警,汽包水位低至-120mm。經(jīng)檢查設(shè)主給水最大設(shè)計流量為680t/h,前置泵流量變送器量程設(shè)置為0~800t/h。DCS組態(tài)中,前置泵流量的判斷使用“幅值報警”模塊來實現(xiàn),該模塊低報警、低低報警值均設(shè)置為200,高報警、高高報警值則均設(shè)置為800,當(dāng)前置泵流量前置泵流量小于200t/h(給水泵小流量保護(hù))或超過800t/h時,均聯(lián)鎖開啟給泵再循環(huán)調(diào)節(jié)閥。這種組態(tài)沒有考慮極端情況,后改為“比較器”模塊,只發(fā)出單一判斷信號。
(3)維護(hù)措施不當(dāng)
不適當(dāng)?shù)厥褂贸墮?quán)限,可能會導(dǎo)致控制器邏輯運算錯誤。如#3機組曾因RB邏輯不完善,熱工技術(shù)人員使用超級用戶權(quán)限在線修改定時器類型時,定時器輸出變位而觸發(fā)機組RB保護(hù)動作。實際上超級用戶權(quán)限是DCS廠家限制使用的權(quán)限,有其不確定性,在安全措施不完善的情況下極易引發(fā)事故,因此其使用要非常慎重。
3 提高DCS可靠性的技術(shù)措施
隨著DCS在火電廠中的廣泛應(yīng)用,其在機組安全穩(wěn)定運行中所占據(jù)的主導(dǎo)地位愈加突出。由于DCS設(shè)備軟硬件的可靠性、控制邏輯的完善和合理性、熱工人員維護(hù)和檢修水平等諸多因素的影響,使機組誤跳閘事件仍時有發(fā)生。因此進(jìn)行有效的技術(shù)管理和正確的檢修維護(hù),保持火電機組DCS的穩(wěn)定、可靠運行也就日漸成為熱工人員日常管理、維護(hù)的重點。為此筆者結(jié)合上述案例分析,從提高控制系統(tǒng)可靠性著手,提出一些防范措施供檢修維護(hù)中參考:
(1)對DCS設(shè)備和檢修維護(hù)實行全過程管理,盡早發(fā)現(xiàn)缺陷并及時處理。完善DCS自診斷和故障報警功能,對DCS運行狀況的實時監(jiān)控不僅要監(jiān)視主控制器的狀態(tài),還要監(jiān)視主控制器網(wǎng)絡(luò)的狀態(tài)。
(2)制定合理的定期維護(hù)制度,詳細(xì)規(guī)定檢查維護(hù)的內(nèi)容、方法和周期,并對檢查結(jié)果進(jìn)行分析,采取針對性的預(yù)防措施。鎮(zhèn)海電廠自從試行這項制度以來,有效地控制了DCS故障的發(fā)生。
(3)制訂DCS應(yīng)急預(yù)案和典型故障處理方案,防止因維護(hù)不當(dāng)引起的DCS故障。
(4)選用品質(zhì)較好的備品配件,如主控制器的散熱風(fēng)扇、DP插頭等,對于易損部件實行定期更換。
(5)對電子室的環(huán)境溫度進(jìn)行遠(yuǎn)程監(jiān)測,接入DCS顯示,實時掌握電子室環(huán)境溫度的變化。使用中央空調(diào)的電子室還應(yīng)注意濕度的控制,如有必要應(yīng)增裝獨立的空調(diào)或除濕裝置。
(6)檢修時對模件電路板外觀進(jìn)行檢查,能起到很好的預(yù)防效果。
(7)深入了解DCS軟件性能,采取合理的組態(tài)方法防止極端工況下的誤動;禁止使用“超級用戶”等不規(guī)范的手段進(jìn)行軟件修改。
其他作者:丁永君(1968-),男,浙江寧波人,高級工程師,從事熱工自動化工作。
參考文獻(xiàn):
[1] 孫長生. 浙江省火電廠2007年熱控系統(tǒng)考核故障原因分析及技術(shù)措施[J].北京: 中國電力, 2008, 5.
[2] MACSTM組態(tài)手冊[M].
摘自《自動化博覽》2010年第八期