服務器日常維護工作有哪些?1、開關機順序及線纜連接1.1、開機順序,下面我們就來說一說關于服務器日常維護工作有哪些?我們一起去了解并探讨一下這個問題吧!
1、開關機順序及線纜連接
1.1、開機順序
打開總電源。
打開計算機機櫃電源
打開外部設備電源(如磁盤陣列、磁帶庫等)
待外部設備自檢完成後,最後打開主機電源.
1.2、關機順序
進行操作系統的關閉
關閉主機電源
關閉外設電源.(如磁盤陣列,磁帶庫等)
關閉其他設備電源和機櫃電源;
1.3、電纜連接注意事項
在進行電纜連接(插拔)時,最重要的一點是,通過該電纜連接(或将要連接)的設備應當是沒有加電的,即應當先将設備的電源關掉,然後再進行電纜連接(插拔)操作。否則,如果帶電進行電纜連接,會造成對設備無法預料的損壞。
2、基本維護常識
• 每天查看服務器狀态,查看内容包括服務器CPU占用,服務器内存占用、服務器硬盤占用,數據庫狀态,數據表狀态
• 注意服務器各個指示燈的狀态(第5節中有對指示燈的詳細說明)
• 每日檢測服務器系統軟件版本更新信息
• 每30天對服務器安全等級評測一次
• 對以上的檢測内容生成報告
• 系統定期自動備份數據
• 若服務器硬盤空間少于10%,則清理硬盤的日志文件
• 若數據庫或數據表狀态出現異常,則修複數據表,并整理數據庫碎片
• 每月服務器登錄密碼更換一次
• 若發現安全漏洞,則需對系統進行修補,打上補丁
3、系統日志的查看收集
系統日志很重要,因為它可以記錄系統中硬件、軟件和系統問題的信息,同時還可以監視系統中發生的事件。用戶可以通過它來檢查錯誤發生的原因,或者尋找受到攻擊時攻擊者留下的痕迹。下面介紹一下windows系統和linux系統下查看收集日志方法:
3.1 windows系統日志
開始→設置→控制面闆→管理工具 中找到的“事件查看器”,或【開始】→【運行】→輸入 eventvwr.msc 也可以直接進入“事件查看器”。如查看其中“系統”請單擊、右鍵可另存日志文件,以便提供技術人員分析。
3.2 linux系統日志
平常主要分析messages和dmesg這兩個文件,查看日志可以拷貝下來後在windows下用寫字闆打開查看,也可以在linux下用more或less命令查看。
/var/log/dmesg : 核心啟動日志.
/var/log/messages : 系統大部份的訊息皆記錄在此, 包括 login, check password , failed login, ftp, su 等。
4、常見故障處理
4.1、服務器無法供電:
市電、UPS、電源線故障(斷電或接觸不良)
電源或電源模組故障,檢查電源,将所有的電源接口拔下,将電源的主闆供電口的綠線和黑線短接,看看電源是否啟動
注意開關按鈕是否彈起良好
主闆或其它插卡造成中斷沖突
4.2、服務器可供電但無法顯示:
檢查各種闆卡是否接觸良好、I/O接線是否連接正常(可拔插部件測試)。
将服務器設為最小配置(隻接單顆cpu,最少的内存,隻連接顯示器和鍵盤)直接短接主闆開關跳線,看看是否能夠啟動。
如果判斷電源正常,則需要用替換法來排除故障,替換法是在最小化配置下先由最容易替換的配件開始替換(内存、cpu、主闆)
4.3、系統頻繁重啟:
電源故障(替換法判斷解決)
溫度過高,尤其是CPU溫度,并注意查看各個風扇
内存故障(可從BIOS錯誤報告中查出)
網絡端口數據流量過大(工作壓力過大)
軟件故障(更新或重裝操作系統解決)
4.4、服務器死機故障判斷處理:
服務器死機故障比較難以判斷,一般分為軟件和硬件兩個方面:
A軟件故障
首先檢查操作系統的系統日志,可以通過系統日志來判斷部分造成死機的原因。
電腦病毒的原因。
系統軟件的bug或漏洞造成的死機,這種故障需要在判斷硬件無故障後做出,而且需要軟件提供商提供幫助。
軟件使用不當或系統工作壓力過大,可以請客戶适當降低服務器的工作壓力來看看是否能夠解決
B硬件故障
硬件沖突
電源故障或電源供電不足,可以通過對比計算服務器電源所有的負載功率的值來作出判斷。
硬盤故障(通過掃描硬盤表面來檢查是否有壞道)
内存故障(可以通過主闆BIOS中的錯誤報告和操作系統的報錯信息來判斷)
主闆故障(使用替換法來判斷)
CPU故障(使用替換法)
闆卡故障(一般是SCSI/RAID卡或其他pci設備也有可能造成系統死機,可用替換法判斷處理)
注意:系統死機故障需要在處理完後需要在一段時間内進行一定壓力的拷機測試來盡一步檢查故障是否徹底解
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!