鋼鐵行業(yè)的信息化網(wǎng)絡(luò)發(fā)展周期一般都比較長,隨著行業(yè)的變動,信息化的發(fā)展缺少整體的規(guī)劃,導(dǎo)致信息系統(tǒng)架構(gòu)分散,獨立,業(yè)務(wù)積累到一定程度之后,形成了多個信息孤島,不僅無法實現(xiàn)有效的數(shù)據(jù)互融互通,甚至連基礎(chǔ)的數(shù)據(jù)安全也難以保證,本方案以東北某鋼鐵企業(yè)信息化為例,通過軟件定義存儲實現(xiàn)對現(xiàn)有基礎(chǔ)存儲的整合與改造,目的是采用盡可能少的投資和業(yè)務(wù)影響來實現(xiàn)架構(gòu)的整合和升級改造,為大數(shù)據(jù)與智能制造提供一個健康的基礎(chǔ)數(shù)據(jù)平臺。
1 鋼鐵行業(yè)信息化現(xiàn)狀
目前我國鋼鐵企業(yè)一般都采用一級,二級,三級,四級的概念來對信息化的功能進(jìn)行區(qū)分,一級、二級、三級都有了一定的積累,有的已經(jīng)達(dá)到比較高的水平,雖然不同鋼鐵企業(yè)具體自動化程度有所不同,但從整個行業(yè)看,基礎(chǔ)自動化、過程自動化在鋼鐵企業(yè)中得到了廣泛應(yīng)用,并伴隨自動化技術(shù)的發(fā)展而逐步加深,互聯(lián)網(wǎng)的發(fā)展推動了無紙化辦公,推動了各種生產(chǎn)管控,推動了ERP系統(tǒng)的發(fā)展,逐漸的形成了四級系統(tǒng)。這種分層的結(jié)構(gòu)很好的區(qū)分了現(xiàn)場控制,過程控制,制造執(zhí)行,經(jīng)營管理的職能,但是卻也因為發(fā)展的時期不同,采用的技術(shù)不同,缺少統(tǒng)一的管理規(guī)劃等原因,導(dǎo)致各級系統(tǒng)之間缺乏聯(lián)動。由于各級使用不同廠家的產(chǎn)品。上線時間跨度也比較大,上線系統(tǒng)上線時缺乏信息化整體規(guī)劃概念,各級系統(tǒng)的硬件環(huán)境多為單臺PC服務(wù)器,有些服務(wù)器甚至硬盤連RAID保護(hù)都沒有,系統(tǒng)上線后硬件缺乏維護(hù),硬件上的應(yīng)用數(shù)據(jù)和環(huán)境沒有備份,使各級系統(tǒng)運行在一個薄弱而獨立的硬件環(huán)境中。雖然有些鋼鐵企業(yè)的四級網(wǎng)絡(luò)已經(jīng)有了一定的規(guī)模,具備了虛擬化甚至云計算的環(huán)境,但是卻無法突破一級、二級、三級網(wǎng)絡(luò)之間的物理限制,無法對下級網(wǎng)絡(luò)中的各系統(tǒng)進(jìn)行管理和運維。
以我看到的環(huán)境為例,一套工業(yè)系統(tǒng),運行在一臺Dell的pc服務(wù)器上,單機運行,服務(wù)器只有一塊硬盤,預(yù)裝的英文win2000系統(tǒng),上面的應(yīng)用就更為復(fù)雜。這樣一臺服務(wù)器放置在生產(chǎn)廠區(qū)中,沒有一個合格的機房環(huán)境,大約7年后。這臺服務(wù)器硬件故障,配套的硬件早已經(jīng)停產(chǎn)了,上面的整套系統(tǒng)根本無法遷移出來。這種情況在鋼鐵行業(yè)中并不少見,陳舊的應(yīng)用系統(tǒng)控制著價值過千萬,甚至上億的設(shè)備,但是這些控制系統(tǒng)卻少有備份。
鋼鐵企業(yè)信息化是一項龐大而復(fù)雜的系統(tǒng)工程,然而信息化浪潮的快速襲來使部分鋼鐵企業(yè)為趕潮流不落后于其他企業(yè)而倉促上馬信息化項目,導(dǎo)致其信息化建設(shè)缺乏必要的深入調(diào)研,對自身情況、需求以及信息化缺乏深入客觀的認(rèn)識,致使其信息化項目的整體規(guī)劃不合理。
2 問題分析
從上述的現(xiàn)狀中,不難看出鋼鐵行業(yè)中的四級網(wǎng)絡(luò)一般都建設(shè)的相對成熟,而二級,三級網(wǎng)絡(luò)因為種種原因,多數(shù)處于一個相對落后,獨立的狀態(tài),也因為這樣,讓底層各級網(wǎng)絡(luò)暴露出了很多的風(fēng)險和問題。
(1)系統(tǒng)獨立,讓各個信息系統(tǒng)成為了安全孤島
由于缺乏整體規(guī)劃,系統(tǒng)上線時候很少會考慮到硬件和網(wǎng)絡(luò)層面的架構(gòu)方案,整個硬件系統(tǒng)都比較簡單,缺乏冗余架構(gòu)的保護(hù),多數(shù)都是單臺服務(wù)器運行,讓一個個信息系統(tǒng)成為孤島,甚至連基本數(shù)據(jù)和系統(tǒng)環(huán)境的備份都沒有。
(2)設(shè)備獨立,資源浪費
硬件的發(fā)展和成本的降低讓服務(wù)器的配置越來越高,但是對于一個個獨立的服務(wù)器來說,更多的硬件資源卻無法發(fā)揮作用。每套獨立的系統(tǒng)消耗著電力,溫度,環(huán)境等無形的資源卻只能發(fā)揮出不到一半的效率,這種情況造成了極大的浪費。
(3)基礎(chǔ)生產(chǎn)數(shù)據(jù)無法有效采集,分析,利用。
由于基礎(chǔ)工業(yè)控制模塊上線比較早,缺乏整體的規(guī)劃,目前鋼鐵行業(yè)中的基礎(chǔ)工業(yè)控制模塊相對都比較獨立,很多地方都是整個生產(chǎn)線,或者整個生產(chǎn)廠共用一個工業(yè)儀表,基礎(chǔ)的生產(chǎn)數(shù)據(jù)無法準(zhǔn)確的反映,缺乏良好的網(wǎng)絡(luò)環(huán)境,讓這些數(shù)據(jù)也無法準(zhǔn)確有效的傳輸?shù)蕉墸壓退募壘W(wǎng)絡(luò)中用來做生產(chǎn)數(shù)據(jù)分析。這就讓管理層與底層的生產(chǎn)數(shù)據(jù)之間沒有有效的信息溝通,無法及時了解真實的生產(chǎn)數(shù)據(jù),難以做出準(zhǔn)確的生產(chǎn)預(yù)判。
傳統(tǒng)鋼鐵行業(yè)信息化架構(gòu)如圖:
3 方案設(shè)計
為了改變現(xiàn)有二級,三級中信息孤島,單一設(shè)備,數(shù)據(jù),應(yīng)用缺乏安全保護(hù),存儲資源沒有充分利用等問題,我們把二級,三級,四級結(jié)合,搭建一套完善的虛擬化云環(huán)境,將原本獨立分離的各級工業(yè)控制系統(tǒng)遷入到云環(huán)境中,實現(xiàn)資源池化,統(tǒng)一管控。為了支撐這樣的虛擬云架構(gòu),我們采用了IBM SVC虛擬化存儲,通過SVC實現(xiàn)兩地三中心架構(gòu)來形成一個堅固的信息化安全架構(gòu)。
由于鋼鐵行業(yè)受生產(chǎn)廠區(qū)影響,信息化網(wǎng)絡(luò)相對都比較集中,根據(jù)實際的需求以及地域性的限制,方案采用SVC Stretch Cluster,和Global Mirro的方式實現(xiàn)兩地三中心架構(gòu),徹底消除了原有網(wǎng)絡(luò)架構(gòu)中的豎井式架構(gòu)。
3.1 首先,我們采用IBM SVC設(shè)備來對現(xiàn)有的異構(gòu)存儲進(jìn)行整合。
鋼鐵行業(yè)的存儲很多時候都是隨著一個應(yīng)用項目上線,但缺乏整體考慮的項目上線往往造成了多臺性能不高,資源不足的存儲同時存在與網(wǎng)絡(luò)中,每套存儲只服務(wù)一個或者幾個應(yīng)用系統(tǒng),無法發(fā)揮更好的性能,形成了一個個的單點故障。為了解決這種情況。我們首先要先通過SVC來整合現(xiàn)有的異構(gòu)存儲,充分利用現(xiàn)有的硬件資源形成資源池。
要實現(xiàn)多種品牌,型號的存儲的異構(gòu)整合,就要解決,磁盤利用率,數(shù)據(jù)遷移停機時間,跨存儲數(shù)據(jù)拷貝,統(tǒng)一管理,擴容許可這些問題。而要解決這些問題也有多種的虛擬化方式來解決,這里我們選用了性價比更高,更穩(wěn)定高效的基于中間層的虛擬化產(chǎn)品IBM SVC,因為:
(1)SVC具備靈活的磁盤管理功能,極大的提高了存儲管理的效率,例如可動態(tài)創(chuàng)建和擴展邏輯卷等。 而且,SVC為各種不同的存儲設(shè)備提供了一個統(tǒng)一的數(shù)據(jù)復(fù)制平臺, 例如瞬間復(fù)制 FlashCopy和遠(yuǎn)程復(fù)制 Remote Mirroring。 這些復(fù)制功能都允許源磁盤卷和目標(biāo)磁盤卷可以存在于不同品牌的磁盤陣列上。
(2)透明的數(shù)據(jù)遷移:當(dāng)SVC被加入到一個現(xiàn)有的SAN 環(huán)境中時,不需要做數(shù)據(jù)遷移, SVC 把現(xiàn)有的磁盤配置原封不動的繼承下來(這是SVC的Image mode), 這樣對服務(wù)器上的應(yīng)用是完全透明的。當(dāng)SVC完全配置好以后, 它又可以將原先磁盤上的卷及數(shù)據(jù)透明的遷移到其他真正的虛擬卷中。 所有的遷移過程對服務(wù)器透明,因此不需要中止應(yīng)用。
(3)IBM SVC是一個軟硬件集成化的產(chǎn)品,專業(yè)的虛擬存儲軟件運行在集群式的硬件引擎上。 它使用了定制的IBM System x 服務(wù)器,運行的存儲操作系統(tǒng)是基于 Linux kernel的。 與SAN網(wǎng)絡(luò)接口是工業(yè)標(biāo)準(zhǔn)的HBA卡。由于SVC是為一個完全開放的存儲環(huán)境設(shè)計的, 兼容各種不同的存儲設(shè)備。用戶可以將各種存儲方案融合其中,而不用擔(dān)心SVC會有什么封閉性。 SAN Volume Controller 天生具備靈活的擴展能力,可以使用戶在存儲性能和存儲容量方面平滑無縫的升級。
例如,擴展控制器個數(shù)可以增加性能,而往存儲池中增加磁盤則可以增加容量, 這兩方面的擴張都可以在線完成,不需要中止應(yīng)用。SVC的主控臺提供了自動向IBM服務(wù)中心報警和遠(yuǎn)程支持的能力。
(4)靈活開放的體系結(jié)構(gòu)
(5)易于實施
(6)易于在性能和容量雙向發(fā)展
(7)企業(yè)級的高可靠性和穩(wěn)定性
(8)提供SSD固態(tài)盤和Easy Tier的支持
對固態(tài)設(shè)備 (SSD) 的創(chuàng)新緊密集成支持 專為關(guān)鍵應(yīng)用程序數(shù)據(jù)提供超高的性能 SVC 架構(gòu)可將 SSD 的性能和容量擴展至高達(dá) 2.4 TB 和每秒 800,000 次讀 I/O,卻只需極小的入門級配置,這有助于使 SSD 更加經(jīng)濟實惠 將數(shù)據(jù)移入/移出 SSD,而不造成中斷;在硬盤驅(qū)動器上創(chuàng)建固態(tài)驅(qū)動器數(shù)據(jù)的副本
3.2 為了消除突發(fā)故障導(dǎo)致的核心生產(chǎn)業(yè)務(wù)中斷,方案中采用SVC Stretch Cluster拉伸式集群架構(gòu)來搭建生產(chǎn)中心第二機房,與第一機房形成雙活架構(gòu),基于vDisk Mirror特性,將SVC集群的兩個節(jié)點分別部署在兩個站點。兩個站點間通過光纖連接,形成集群。在兩個站點分別連接不同的存儲陣列,兩個站點間的SVC節(jié)點處于同一個集群,每個站點占一半的SVC節(jié)點。通過這種方式,提供存儲雙活解決方案。
SVC Stretch cluster的風(fēng)險在于同一I/O GROUP只有兩個SVC節(jié)點,本地一個,災(zāi)備一個。本地SVC節(jié)點故障,則切往了災(zāi)備SVC節(jié)點,冗余度來說,本地有點單點的感覺;另外SVC Stretch cluster對兩個站點間的鏈路要求很高,需要穩(wěn)定度高,時延和抖動盡量小,如果兩中心間鏈路中斷,那么兩個中心的SVC節(jié)點讀寫將HOLD住,直到第三站點仲裁選舉出勝利站點,如果所有業(yè)務(wù)主機均通過SVC節(jié)點訪問存儲,所有業(yè)務(wù)將有一段時間被中斷,中斷時間取決于兩個站點間距和仲裁時間。而在本方案中之所以選用這種方式,是基于鋼鐵行業(yè)的特點考慮。
鋼鐵行業(yè)的生產(chǎn)基地往往規(guī)模都比較大,又相對集中,形成一定規(guī)模的區(qū)域,網(wǎng)絡(luò)覆蓋距離廣,所有生產(chǎn)信息點的匯聚受地理條件限制,無法像銀行,政府一類的單位實現(xiàn)大跨度的雙活結(jié)構(gòu),所以 本方案中的雙活機房距離相對較近,兩機房之間有條件直接鋪設(shè)多條專用的主干光纜來既實現(xiàn)雙活又最大限度的消除延遲,抖動等線路質(zhì)量的影響。
鋼鐵行業(yè)的信息化發(fā)展參差不齊,但基本上都有了一定的規(guī)模,無法按照全新網(wǎng)絡(luò)架構(gòu)一樣去考慮雙活,要做到盡可能小的影響現(xiàn)有的生產(chǎn)業(yè)務(wù),又要實現(xiàn)業(yè)務(wù)的高可用,就只能逐步去改造信息架構(gòu),通過分步的實施來降低全面的架構(gòu)改造帶來的風(fēng)險。
鋼鐵行業(yè)中,多數(shù)現(xiàn)存大量的存儲和設(shè)備,全新的架構(gòu)改造會造成這些設(shè)備資源的浪費,通過分步實施,充分利用現(xiàn)有的硬件資源逐步實現(xiàn)雙活,對于低迷的鋼鐵行業(yè)來說,可以一定程度的減輕企業(yè)的負(fù)擔(dān)。
對于鋼鐵行業(yè),生產(chǎn),辦公的信息化為位內(nèi)部訪問,業(yè)務(wù)訪問量相對穩(wěn)定,業(yè)務(wù)的波動也是有跡可循,所以一般不會出現(xiàn)無法預(yù)估的突發(fā)訪問,引起上層系統(tǒng)由于資源不足而在兩節(jié)點中遷移。
綜合這些原因,在方案采用了SVC Stretch Cluster架構(gòu)。
3.3 因為方案中的雙活機房距離較近,為了應(yīng)對極端情況,如地震,水災(zāi)等人力可抗因素,方案中又增加了一個應(yīng)急數(shù)據(jù)中心。
在異地建設(shè)一套獨立機房,通過Global Mirror實現(xiàn)與主生產(chǎn)區(qū)中的生產(chǎn)數(shù)據(jù)同步,作為生產(chǎn)數(shù)據(jù)的最后屏障,確保生產(chǎn)機房遭遇極端情況時候臨時生產(chǎn)指揮中心。在應(yīng)急中心中,采用全冗余架構(gòu)來保證設(shè)備的安全性,最大限度的保證生產(chǎn)數(shù)據(jù)安全。
4 方案價值
在現(xiàn)有的鋼鐵行業(yè)中,可以對整體方案進(jìn)行分步實施,先進(jìn)行異構(gòu)存儲整合,然后建立新的生產(chǎn)機房,進(jìn)行線路改造,投入性能更好,更穩(wěn)定的存儲來作為第一機房,將原有的核心機房降級為第二機房,與第一機房形成雙活存儲架構(gòu),配合上層虛擬云的HA,實現(xiàn)生產(chǎn)系統(tǒng)的高可用架構(gòu)。建設(shè)應(yīng)急數(shù)據(jù)中心,實現(xiàn)對數(shù)據(jù)中心的災(zāi)備環(huán)境。
分步的方案實施可以最大限度的保證項目成功落地運行,充分的利用現(xiàn)有的資源完成存儲虛擬化,系統(tǒng)虛擬化的云平臺底層架構(gòu),然后建設(shè)新的機房來與現(xiàn)有生產(chǎn)環(huán)境對接形成雙活中心,配合異地的數(shù)據(jù)容災(zāi)對生產(chǎn)數(shù)據(jù)形成全面的保護(hù)。而其中最底層也是最重要的,就是存儲虛擬化的架構(gòu)。通過SVC實現(xiàn)存儲虛擬化的私有云環(huán)境擺脫了傳統(tǒng)存儲架構(gòu)的限制,易于擴展、自動化、基于策略或者應(yīng)用的驅(qū)動,透明性,虛擬數(shù)據(jù)路徑這些都是傳統(tǒng)存儲架構(gòu)所無法比擬的,而且還可以將現(xiàn)有的 不同規(guī)格的舊存儲進(jìn)行統(tǒng)一管理有效利用現(xiàn)有的資源,這降低了鋼鐵行業(yè)信息化的投入成本,讓那些運行了3年5年的設(shè)備可以作為輔助存儲來完成新舊存儲的升級更換。
來源:吉林通鋼自動化信息技術(shù)有限責(zé)任公司