DCS人機界面的死機現象及處理辦法
發布時間:2019-07-29 08:08:28來源:
DCS死機現象有兩種:人機界面死機、控制器死機。前者比后者損失要小。控制器死機是I/O卡件安排太多或存儲器容量不夠,一旦控制器程序運行到某一位置,就停留在該位置,程序不再往下走,即使重啟也無濟于事。
人機界面(主要是操作站)死機現象所有DCS都不同程度地存在,只是頻繁程度不同。另外與DCS使用時間長短有關。因硬件引起的死機,顯示不再能恢復。如操作站電源電壓偏低,很容易使操作站死機。由于軟件和通信連線的速率選擇不合適引起的死機現象經一段時間仍能恢復。操作站操作系統與監控軟件磨合不好也能引起死機,對此維護人員毫無辦法,稱為原發性死機。由于某些配置不合理引發網絡堵塞、內存太小等原因造成的死機,過幾分鐘后自己能恢復。
本文討論的僅限于因系統、網絡配置不合理等原因引起的死機現象,推薦一些處理辦法。
一 DCS人機界面的死機現象
近來,由于MIS系統需從DCS中讀取生產實時數據。在網絡中接進動態數據服務器,有的采用DDE方式,在讀取數據較多情況下(如3000點),由于DDE消耗資源較多,網絡堵塞現象就變得十分頻繁,并使得各種人機界面的節點死機現象變得嚴重。
網絡堵塞現象的嚴重程度與多種因素相關。從操作站取數據,采用DDE方式,如果取的數據在500點以下,問題還不算太大。如果取幾千點數據,操作站死機幾乎是必然的。如果把節點連到DCS的通信網絡上,從網絡接口取數據,情況要好一些。
控制器把數據送到接口,人機界面從網絡接口讀取數據應遵守網絡通信協議。網絡物理結構有環型和總線型兩種,總線網絡在邏輯上也是環型的。星型網絡只用于小系統(100個I/O點內)。常用通信協議是廣播式,網絡上的節點只要把數據送到網絡上,它就要不斷廣播數據,需要數據的節點就接收數據。廣播式協議的網絡除這種方式外,還有一種方式:一個節點向網上其他節點問詢數據,如其他節點沒有,它就反復進行問詢直至讀取到這個數據。如果網絡上根本沒有這個數據,就會造成網絡堵塞。
為使運行人員熟練DCS操作站的操作,可采用仿真系統,了解DCS的鍵盤,以減少誤操作引起死機;也可了解操作站死機情況。
在DCS運行時間較長的情況下,組態只加不減,有一部分組態實際上已沒有與真正的I/O點相連,與控制無關。在工程師站的用戶應用程序中有這樣的I/O點。動態數據服務器接入時,欲將DCS上所有數據點都讀上去,因其中有大量數據點無效而造成網絡堵塞,所以人機界面就發生死機。這時可用逆向工程師站讀取控制器中的組態,與正向工程師站的內容進行比較,刪除無效點,就可避免網絡堵塞。
另一個應注意問題是在接入動態數據服務器時,應檢查所有接口的軟件版本是否一致,否則會影響數據傳遞。
解決網絡堵塞的第三種方法是:如果采用例外報告方式,可加大例外報告區域以減少網絡通信量。例外報告是指現場某點只在發生變化時把數據送到網絡上。為防止點已壞而人機界面未知的情況,即使點不變化,超過一段時間也要報告。為減少網絡上的通信量,把例外報告的兩個參數都適當加大,也能達到減少數據量的目的。
比較近推出的通用操作站多采用Windows NT/2000操作系統,監控軟件也通用,如FIX、InTouch等。由于軟件銷售量大,存在問題較少,通用操作站開放性好,死機現象大大減少。如果驅動軟件不太好,也會引起死機。重要的是,它無論維護成本、備件采購都不受DCS制造廠家的限制。但為防黑客、病毒侵入,防火墻不可缺少
。二 C/S結構的人機界面的死機現象
1. C/S結構 DCS人機界面采用普通PC、Windows操作系統以后,為增加人機界面數量,采用C/S結構,只要控制器上通過接口與服務器相連,服務器和客戶機上使用網絡接口適配器用電纜連接,就成為C/S結構。
客戶機共享服務器的資源。服務器通常安裝在安全場所,保存DCS控制器送來的比較有價值的現場生產數據。圖1示出客戶機和服務器的連接關系。
作為服務器的計算機可能同時為幾臺或十幾臺客戶機服務,所以服務器須要具有比客戶機更快的處理器、較大的內存和更大的存儲空間。
客戶機是標準的PC運行Windows操作系統,僅與服務器通信,不和其他客戶機通信,有自備軟件包。在作DCS操作站時,服務器和客戶機可運行同一監控軟件,以便共享服務器資源。兩者所裝軟件的區別是服務器應有DCS控制器驅動軟件而客戶機不需要。
還有一種情況是,在服務器監控軟件上安裝OPC服務器,在客戶機監控軟件上安裝OPC Client,客戶機就可訪問服務器。如在服務器上不需用圖形方式觀察現場設備運行情況,在服務器上也可不安監控軟件,而只安OPC服務器,只是在查找故障時,才需要顯示器。
采用C/S結構可節省DCS昂貴的網絡專用接口。為系統可靠運行,采用雙服務器冗余運行,這就是雙機雙網。一個系統比較多用到兩個專用接口。
比較終用戶反映,采用多個接口的多主站結構較好,原因是服務器和客戶機安排不合適容易死機。如INFI90的Conductor NT和Honeywell的GUS在版本較低情況下都容易死機。 2. C/S結構死機現象的產生
C/S結構網絡的兩種硬件,通常稱為客戶PC和服務器。客戶PC在中央控制室,而服務器放在安全的地方。DCS操作站死機的原因錯綜復雜。本文僅限于分析由于采用C/S結構引起的死機原因,有兩種情況:
網絡的連接線和選用不合適的網絡適配器 控制器、服務器和客戶機三者之間的連接有兩種情況:一是DCS控制器有以太網接口,三者用以太網交換機來連接。交換機有多種端口,每個端口數據傳輸速率可以不等。端口數量由連接的計算機臺數決定。交換機主要指標是背板寬度和存儲器大小。如果采用以太網電纜如10BASE、100BASE等的速率都可傳輸,如采用5類線只能是10BASE。在圖2以太網的連接是星型。使用離散的電纜將每臺計算機連接到中央連接點,通常稱為網絡集線器。每臺計算機使用獨立電纜,連接失敗只影響有關的單臺計算機,其他計算機可繼續運行。如果各臺機器適配器速率相同,以太網星型連接通常使用10BaseT電纜。 控制器把信息送給服務器,客戶機從服務器讀寫數據,由于客戶機數量較多,如果它們之間采用一樣的連線就可能死機。各臺客戶機從服務器讀取的數據可以一樣,也可以不一樣。也可以是所有客戶機顯示內容一樣,多臺操作站冗余運行。每臺操作站與服務器交換的數據較多,可采用100BASE端口,服務器和控制器數據交換較少,該采用10BASE端口,客戶機之間基本不交換數據,也可采用10BASE端口。如果不這樣,很可能產生客戶機死機。
客戶PC和服務器的配置不合適 客戶PC的配置取決于準備使用的操作系統。如DOS和Windows 3.1只要8MB內存就可運轉,而Windows 9x至少要16~32MB,Windows NT比較少要32MB,比較好是64MB,特別是Windows 2000,更需要64MB內存。除內存外對Windows 2000來說,應采用更快的處理機和更大空間的硬盤。
在選用客戶PC時,雖然可以比服務器的機器差一些,但內存一定要比上面的要求還高一些。因為機器除運轉操作系統以外,還要與服務器讀寫數據。
服務器的CPU和硬盤驅動器承受網絡上所有客戶機的服務請求。服務器需要大量存儲器,比客戶機存儲器容量要高得多才行。
比較好知道主板上存儲器插槽數目和支持的比較大內存數量。檢查隨DCS服務器來的存儲器是如何配置的。單條64MB DIMM機器比用16MB模塊插滿4個插槽的機器更容易升級。
服務器比較好采用支持ECC內存的存儲器。當ECC存儲器與一個支持ECC的主板芯片組一起使用時,可糾正單個位存儲器錯誤和檢測多位存儲器錯誤。
硬盤驅動器對于服務器也很重要,連在網上的計算機都共享服務器文件,硬盤驅動器應耐用、可靠和適用于同時為多個用戶服務的。因此,采用SCSI硬盤驅動器較合適。SCSI驅動器有智能和較快的轉速,采用UtraWideSCSI時從驅動器到系統間有極高數據傳輸率。無論是IDE硬盤驅動器還是SCSI硬盤驅動器,都可采用RAID技術,能更安全地保存數據,提高服務器質量。SCSI總線可連接多臺硬盤驅動器,采用一臺9GB的硬盤驅動器沒有9臺1GB的SCSI硬盤驅動器的效率高。
市場上有一種磁盤陣列,專為服務器設計,是一種海量存儲器產品。硬盤驅動器陣列可裝入大量驅動器,用磁盤鏡像或RAID提供容錯,自動將服務器數據的多個拷貝存儲到不同硬盤驅動器上。當驅動器發生故障時,所有數據依然對用戶有用。有些陣列驅動器甚至可熱交換,能在機器運行時更換故障。
服務器使用的RAID比較好版本是RAID5,能為所有現在版本的C/S網絡操作系統所支持。RAID5數據“分析(stripes)"到多個SCSI驅動器上,使單個損壞驅動器上的內容可以從陣列中其他驅動器的信息里重建。當一個帶熱交換驅動器和供電的服務器結合在一起時,RAID5可使服務器以接近連續的24×7正常運行。
如果DCS不是采用C/S結構的操作站,因各個操作站互相獨立,只保存一部分數據,如果是冗余配置,可靠性已很高,就不一定采用RAID技術。
DCS操作站為文件備份,可在操作站上安裝一個SCSI磁帶驅動器。采用C/S結構的,在服務器上比較好安裝磁帶機,可把用戶組態的應用軟件拷貝在磁帶機上。操作站或服務器發生故障時,能把應用程序重新輸入。磁帶機產品更新也較快,1990年左右進口DCS配備的磁帶機現在已買不到備件或磁帶,新老磁帶機和磁帶不兼容。
S9000系統控制器由兩部分組成,一塊3C905卡完成模擬量控制,另一塊PLC主機LPM620-0072,主機上有以太網口,它在組成系統時,采用以太網連接,組成C/S結構。以太網連線有兩種方式,在客戶機較多情況采用集線器連接。
如果只用1~2臺操作站和1~2臺控制器就把所有操作站、控制器連在公共電纜上,網上連接設備很少,也可以采用T型連接器。
服務器比客戶機包含更多驅動器,還需考慮它的電源功率和可靠性。電源很容易被忽視,如忽視電源直流輸出是否穩定,還有噪聲、雜散信號、尖峰脈沖和浪涌。電源是比較容易出故障的部件之一。電子線路采用+3.3V或5V,硬盤驅動器和風扇采用+12V電壓。
有以太網的網絡適配器,也有其他網絡適配器,但都不如以太網用得多,所以價格也高。采用以太網能降低DCS成本。
三 容易產生死機的系統實例
設計一個系統,操作站采用C/S結構,連線如圖3所示。如配置8臺操作站,2臺服務器,下位是4臺S9000控制器,需要在操作站中顯示的I/O點數為2000,控制器和服務器通過以太網通信。控制器、服務器和控制器的物理連線是通過16端口的集線器(Switch Hub)。16端口集線器的速率缺省值是100BASE。如果服務器和操作站的適配器是10BASE,服務器和客戶機的內存都是64kB,系統運行后死機現象較嚴重。
把服務器的一塊適配器換成100BASE,客戶機仍采用10BASE網絡適配器,把服務器內存增加到256kB、客戶機增加到128kB,情況改觀很多。
從實際情況看,服務器和操作站死機原因與服務器內存容量關系很大。64kB的內存是比較基本的,它的內存應該與操作站臺數有關。運行情況表明,增加一臺操作站服務器至少需要增加10~30kB內存。服務器內有兩塊網絡適配器,與控制器通信的采用10BASE,與操作站通信的采用100BASE,操作站可以采用10BASE的適配器。連線采用普通電纜。
如果服務器軟件和操作站軟件是fix,原來S9000的操作站就是采用該軟件,操作系統是Windows 3.2,死機情況不太嚴重。目前S9000系統監控軟件是專用的,該軟件可能還有一些BUG,再加上網絡、內存配置不太合理,死機現象十分嚴重。
客戶機應該組態的那一臺服務器是主服務器,另一臺是從服務器。否則,當一臺服務器發生故障時,另一臺服務器不能很好工作。如果有3服務器的話,組態更是重要。