siemens x
傳感器

工控機磁盤工作故障的防護與排除方法

2025China.cn   2009年11月24日

 一、 引言:
       隨著工業(yè)與計算機的快速發(fā)展,在自動化程度越來越高的今天,計算機也應用到自動化控制系統(tǒng)的方方面面。工業(yè)控制計算機(以下簡稱工控機)的安全也顯得尤為重要。工控機與普通計算機的技術原理相同,組成結構也差不多,只是在工控機強調(diào)的是其工作穩(wěn)定性。工控機一般工作在相對惡劣的環(huán)境下工作的,對環(huán)境溫度、濕度、供及電壓、平穩(wěn)性、通風性能等要求比較高,但工作環(huán)境往往達不到要求,工控機也容易發(fā)生故障,部分硬件出現(xiàn)問題還能及時更換,一旦磁盤發(fā)生損壞,會造成大量記錄數(shù)據(jù)丟失,控制軟件破壞,短時間無法修復,造成被控參數(shù)控制不穩(wěn),往往帶來巨大的經(jīng)濟損失。

      二、 故障現(xiàn)象描述:

      工控機長時間運行后,(長時間指:包括連續(xù)工作一個標準月30天/24小時工作制及以上的時間),機箱內(nèi)積集大量灰塵,機箱溫度較高。通常在不關機的情況下一切工作正常,一旦因電力供應不足或需要緊急停機時,控制系統(tǒng)容易出現(xiàn)磁盤無法啟動、系統(tǒng)無法加載、長時間處于登陸畫面等故障。

      三、 故障分析及排除方法:

      引起磁盤故障的原因非常多,我們在這里大概的分為磁盤本身的質量問題和工作環(huán)境引起的故障問題。

      磁盤本身的質量問題,我們無法深入考究,只有在開始做控制系統(tǒng)時,選擇購買質量、品牌較好硬盤,也可以利用Scandisk、Norton Disk
      Doctor等軟件進行磁盤表面缺陷檢測。假如我們能夠預知硬盤的質量和健康狀態(tài),這將為我們選擇硬盤和備份重要數(shù)據(jù)贏得時間。筆者在網(wǎng)上發(fā)現(xiàn)一款名為Drive  Health軟件,可以檢測硬盤的使用壽命,可以幫助大家提前得知硬盤健康狀態(tài)。

      工作環(huán)境引起的故障問題,常見的有下面幾個方面:

      1、 工控機工作時間長。由于正常生產(chǎn)的需要,部分工廠的工業(yè)控制系統(tǒng)需要長時間工作,給工控機操作系統(tǒng)帶來巨大考驗。據(jù)微軟的操作系統(tǒng)運行時間報告中表明,微軟聲稱其Windows
      2000后的操作系統(tǒng)可以支持長時間工作,但從實際運行看,運行時間超過一周后,磁盤在龐大數(shù)據(jù)交換過程中,會積累大量的數(shù)據(jù)碎片,容易造成磁盤邏輯壞道、讀寫錯誤及系統(tǒng)運行和啟動變慢。所以工控機在生產(chǎn)允許的情況下,可定時進行重啟工控機和磁盤碎片整理,以減少因長時間工作導致的磁盤錯誤。重啟時間可按工控機處理數(shù)據(jù)量的大小和生產(chǎn)情況而定,它不是硬性的,需要讀者慢慢摸索。從筆者的實際經(jīng)驗來看,一個標準月(30天)重啟和整理一次工控機可以減少磁盤錯誤的機率。

      2、 工控機內(nèi)部溫度過高。在需長時間高溫運行的環(huán)境中,計算機各元件極易發(fā)生老化、硬盤故障的頻率也較之升高。這就需要工廠的自動化系統(tǒng)維護人員在日常巡檢中,密切關注機箱溫度,盡量使工控機的溫度保持在10--30攝氏度之間,過高、過低的溫度都不適宜硬盤的保護,如果機箱溫度達到30攝氏度,內(nèi)部硬盤的溫度會達到40度或更高。我們可以簡單DIR一下自己的工控機,以達到降低環(huán)境溫度的作用。一、更換大功率CPU、硬盤風扇(硬盤風扇要注意固定,不宜安裝在硬盤固件架上,以防因風扇轉動帶來硬盤震動)加快散熱;二、在機箱內(nèi)部加裝向機箱外抽風的風扇,增加空氣對流;三、在放置工控機的機柜上,安裝小型軸流風機;四、在控制室加裝空調(diào),以降低空間溫度。
      3、 環(huán)境濕度不適宜。工控機主要是由眾多電子元件的集成電路構成,其絕緣性能跟環(huán)境濕度有很大關系。濕度過大,容易造成電路板短路而燒毀;濕度過小,容易產(chǎn)生靜電,也會擊穿部分電子元件。因此,濕度過大、過小,都會給工控機帶來潛在的威脅。靜電防護問題上要求我們工控機上必須要有良好的儀表接地。值得說明的是,工控機接地極不同與土建上的防雷接地,接地極選址應距控制室處三米遠,在室外的地坪下1700mm處用∮20鍍鋅角鋼作垂直接地極,接地數(shù)量滿足接地電阻小于1歐姆(回填時應用搖表測試),再采用40*40*4鍍鋅扁鋼與接地體可靠焊接(每個焊接點還要做仔細的防銹處理),分至建筑物內(nèi)換接25mm銅電纜至系統(tǒng)地端子和工控機接地點。這樣可以有效的減少靜電帶來的危害。

      4、 地面震感大。很多工廠生產(chǎn)中需要電機產(chǎn)生拖動、震動等物理性位移動作,不僅帶來巨大的噪音,機器工作時帶來的震動會給工控機磁盤、光驅、軟驅帶來巨大的損害。磁盤生產(chǎn)的工藝越來越高,現(xiàn)行轉速已達到7200轉每秒乃至更高。在自動化控制系統(tǒng)中的大量數(shù)據(jù)交換中,長時間、高速度運轉的磁盤,容易因磁盤震動,導致磁盤讀寫能力下降,磁頭定位緩慢,甚至造成磁盤損壞;因此減少工控機環(huán)境震感,有利于保護磁盤。我們可以在工程設計時,盡可能的讓工控機遠離震源大的工作現(xiàn)場;如果工作地點無法更改,我們還可以在工控機柜、箱體下墊置海綿、可緩沖性物體以減小震動帶來的危害。
      5、 空氣中的可吸入顆粒物多。很多工廠的原料大多需要粉料進行加工,加上外界空氣流動大、沙塵多,工控機內(nèi)容易集積大量粘糊狀積塵,造成工控機內(nèi)局部溫度過高,帶來硬件損壞。這種情況多發(fā)于CPU、電源、硬盤、顯卡等散熱風扇周圍。積塵較輕的地方,在正常生產(chǎn)允許的情況下,可以采用定時吹塵。積塵較嚴重的地方,可以工控機箱透風處安置濾塵紗布,定期清理。

      6、 供電電壓波動大、易停電。工業(yè)和生活快速的發(fā)展,對電的需求量也日益增大,很多地區(qū)有電力供應不足、電壓不穩(wěn)、易停電的情況發(fā)生。電壓不穩(wěn)和突然停電,造成系統(tǒng)頻繁重啟,系統(tǒng)文件也容易因此發(fā)生丟失而無法正常啟動;正在執(zhí)行讀寫動作的磁頭,有時會因為停電造成磁頭回位不準帶來工控機磁盤故障。因此工控機工作環(huán)境電源的穩(wěn)定關系到工控機工作正常與否。我們可以采用穩(wěn)壓電源和UPS不間斷電源進行保護,具體設備選型,要依負載功率大小、需保持工作時間多少來定。
      四、 故障救急策略:

      很多時候,我們的工控人員做了很多保護工作,仍然有工控機磁盤發(fā)生故障的情況,下面我們就與讀者探討一下如何在發(fā)生故障前采取補救措施。建議讀者先學會使用GHOST(著名的磁盤克隆軟件)軟件,對象版本盡可能最新,這將有助于下列方案的實施。

      無需資金投入方案:GHOST克隆鏡像。

      方案前提:僅僅系統(tǒng)盤出現(xiàn)故障,系統(tǒng)盤可以被FORMAT軟件正常格式化。(筆者曾遇到兩次無法正常用FORMAT軟件格式化系統(tǒng)盤,主從盤方式下,訪問壞磁盤的系統(tǒng)盤時,提示參數(shù)錯誤,采用低格后恢復)
      方案材料:GHOST軟件、DOS系統(tǒng)引導盤(可光盤、軟件、U盤)
      方案實施:磁盤故障大多發(fā)生在系統(tǒng)盤(C盤),在自動化系統(tǒng)正式投入運行后,首先利用GHOST軟件,對系統(tǒng)盤進行鏡像,將鏡像文件(*.GHO)放至FAT32磁盤格式下進行備份(因為單磁盤情況下,對系統(tǒng)盤進行GHOST恢復,一般在DOS下進行,DOS只能運行在FAT32、FAT16等磁盤格式下,在NTFS的分盤格式下是不能被運行的。),一旦系統(tǒng)盤發(fā)生故障,最快的方法可將系統(tǒng)盤格式化掉,利用GHOST軟件可在5分鐘左右將原鏡像好的文件恢復到系統(tǒng)盤。
      方案結論:無需設備投入,無需資金花銷;恢復速度快。此方案只能針對于操作系統(tǒng)破壞而非磁盤發(fā)生物理性損壞的情況下采用;一旦磁盤物理損壞,此方案將無法進行。這也可推廣至整個磁盤鏡像。

      經(jīng)濟型方案:克隆雙硬盤備份+GHOST鏡像

      方案前提:工控機磁盤故障(無論是系統(tǒng)故障還是磁盤物理性損壞)
      方案材料:目標工控機內(nèi)同型號磁盤一塊、GHOST軟件、DOS系統(tǒng)引導盤(可光盤、軟件、USB盤)
      方案實施:在工控機系統(tǒng)投入運行之前,利用GHOST軟件先將存有控制系統(tǒng)磁盤的系統(tǒng)盤(C盤)鏡像至該磁盤的非系統(tǒng)盤FAT32磁盤格式分區(qū)下,再將其整個硬盤內(nèi)容完整克隆至同型號備用磁盤內(nèi)。一旦出現(xiàn)操作系統(tǒng)損壞,可將操作系統(tǒng)鏡像文件恢復;如果發(fā)生整個磁盤故障,可將壞磁盤拆除,換上先向備份好同樣內(nèi)容的備用硬盤即可。
      方案結論:只需投入一塊磁盤的資金(約400-800元人民幣之間,視磁盤大小、廠商的不同)、更換容易、恢復速度快、可排除所有磁盤問題。

      安全性投入方案(經(jīng)濟型):采用Windows 2000雙硬盤RAID1或三硬盤RAID5方式的軟件磁盤陣列

      方案前提:此方案的實施時間,最好在工控機投入運行之前
      方案材料:Windows 2000系統(tǒng)盤或更高版本、磁盤兩塊(型號相同為宜)
      方案實施:首先安裝Windows 2000系統(tǒng)或更高版本(因為微軟在Windows
      NT后對磁盤陣列比較好),啟動磁盤陣列功能支持。磁盤陣列方式能在工控機運行時的寫操作,同時向兩塊磁盤寫入相同的內(nèi)容,假如兩塊磁盤有一塊發(fā)生故障時,另一塊磁盤因為是同時寫入的相同內(nèi)容,能無擾的切換正常工作狀態(tài)。也就是說,磁盤陣列方式下的兩塊硬盤中只要有一塊磁盤沒有損壞,重要數(shù)據(jù)就不會丟失。事后可再更換或維修壞磁盤,最大好處就是不會影響到生產(chǎn)數(shù)據(jù)的丟失,更換速度也很快。
      方案結論:投入較小,安全性高,穩(wěn)定性跟系統(tǒng)安裝設置好壞有關、但技術初學者不易掌握。

      安全性投入方案(穩(wěn)定型):采用低端服務器硬件磁盤陣列方式(面對技術要求低、穩(wěn)定生產(chǎn)高、數(shù)據(jù)相當重要的地方使用)

      方案材料:支持硬件磁盤陣列功能的低端服務器一臺約2萬5千元人民幣左右
      方案實施:因為是采用硬件方式的磁盤陣列,所有外界對其干擾低,故障發(fā)生率低。在發(fā)生磁盤故障時,只需對壞硬盤進行拆除,補充相同型號新硬盤即可。具體實施辦法,詳情請咨詢低端服務器提供商。
      方案結論:投入相對較大、安全性高、穩(wěn)定性好、技術要求低。

      五、 結束語:
      工控機磁盤故障帶來的危害不言而喻,保證它的安全是我們工控人員應該關注的問題,只有我們事先做好詳細的防護措施,工控機才能穩(wěn)定、高效的運行。筆者在實際工作采用上述辦法,有效避免了工控機磁盤故障,能將故障的修復時間由原來的幾個小時,縮短為幾分鐘,為正常生產(chǎn)提供保障。筆者水平有限,差錯與不足的地方還望讀者不嗇指正。


 

(轉載)

標簽:工控機 我要反饋 
2024世界人工智能大會專題
即刻點擊并下載ABB資料,好禮贏不停~
優(yōu)傲機器人下載中心
西克
2024全景工博會
專題報道