三十六計 之 第二十五計:偷梁換柱
一間公司的網路壞掉,通常不是壞,是「被改了」。
這次的案子從一通求助電話開始。客戶反映 NAS 狀態不穩定,異地備份任務也持續出現錯誤。遠端連進去診斷,我就知道這不只是設備問題。
━━━━━━━━━━━━━━
📡 異常一:設備看得到,但抓不到
第一個奇怪的地方出現了。
用原廠提供的管理工具,可以正常找到 NAS 的詳細資訊。但換成一般的網路掃描工具,或者直接查 ARP 表,卻完全看不到這台設備的 IP 存在。
這種「廠商工具看得到,標準協定看不到」的狀況,通常意味著網路層出了問題,而不是設備本身故障。這是第一個線索。
━━━━━━━━━━━━━━
🔀 異常二:Gateway 被換掉了
接著進行更詳細的網路掃描,發現一件讓我高度警覺的事。
這個客戶原本的網路架構設計是這樣的:主站與分站各自部署一台企業級 VPN 路由器,兩台設備透過 Internet 建立加密通道,讓分站的 NAS 可以定時將資料備份到主站的 NAS。這是一個相對標準、可靠的異地備份架構。
但掃描結果顯示,分站那一端的企業級 VPN 路由器,已經被換成了一台消費級 Wi-Fi 路由器。
現場詢問了相關人員,才得知是分站同仁自行找當地店家協助處理網路問題,店家在不清楚原有架構的情況下,直接把路由器換掉了。新的設備沒有 VPN 功能,也沒有留下任何管理帳號與密碼。

結果很直接:兩個站點之間的 VPN 通道完全消失,分站 NAS 的所有備份任務全數失敗。但內部的日常檔案存取,還勉強維持正常運作——這也正是最危險的地方。沒有人知道備份已經中斷多久了。
━━━━━━━━━━━━━━
⚡ 異常三:分站 NAS 還有另一個獨立問題
排查過程中發現,分站的 NAS 本身也有狀況。
設備會不定時從網路上消失,需要現場人員到機房手動重開才能恢復。這種「時好時壞」的症狀,加上現場環境沒有配置 UPS,研判與電力品質不穩有直接關係。突波與電壓不穩定,不會每次都讓設備壞掉,但會讓系統累積異常、縮短硬碟壽命,並在你最不注意的時候讓備份中途中斷。
這個問題與 VPN 通道消失是兩個獨立的故障,同時存在,大幅提升了排查的複雜度。
━━━━━━━━━━━━━━
🔄 處理流程實錄
釐清所有問題根源之後,展開完整的還原作業。
首先針對分站 NAS 進行 reset 與系統重開,並將 OS 從舊版升級至最新穩定版本。接著重新登入管理帳號,安裝必要套件,逐步還原快照設定與備份排程。最後恢復遠端存取功能,讓現場同仁逐一確認可以正常存取所有檔案。
整個過程中,需要現場人員配合進機房手動操作數次。設備已開案交由原廠技術部門持續追蹤穩定性問題。
━━━━━━━━━━━━━━
⚠️ 尚未完成的部分
截至結案,仍有一個待處理項目:兩個站點之間的網路接線需要重新確認與整理,VPN 備份通道的完整恢復,需要另行安排時間現場處理。
━━━━━━━━━━━━━━
💡 這個案例真正的教訓
這次事件的根本原因,不是設備故障,而是「架構在不知情的情況下被改動了」。
分站同仁遇到網路問題,找了當地店家來處理,這個決定本身無可厚非。問題在於,店家不了解原有的 VPN 架構設計,做出了一個看似解決眼前問題、實際上破壞了整體架構的替換。而且替換完成後,沒有任何人通知 IT 負責方,沒有任何文件記錄,備份中斷的狀況就這樣靜靜持續著。
企業級路由器與消費級 Wi-Fi 路由器,外觀類似,功能差異巨大。前者支援 VPN、具備細緻的路由設定,是跨站備份架構的核心元件。後者設計用途是家庭上網,根本沒有這些功能。用後者替換前者,就像把廠房的防火門換成普通木門——外觀看起來沒差,但關鍵時刻差很多。
━━━━━━━━━━━━━━
🛡️ 給中小企業主的三個建議
第一,任何網路設備的異動,都應該事先通知 IT 顧問或負責人,而不是直接找當地店家處理。設備之間的相互依賴關係,往往比外觀看起來複雜得多。
第二,異地備份的通道需要定期驗證。備份任務顯示「執行中」不代表資料真的有備過去,需要定期確認目的地資料的完整性與時效性。
第三,NAS 和網路核心設備應該配置 UPS。不只是為了應對停電,防突波與穩壓才是保護設備長期穩定運作的關鍵。一台幾千元的 UPS,對應的是幾十萬資料的安全。
━━━━━━━━━━━━━━
你可以試著問自己一個問題:如果你公司的分站今天有人換了一台路由器,你會知道嗎?
如果答案是不確定,這就是值得認真面對的風險。
━━━━━━━━━━━━━━
相關服務:IT 環境健診 / 委外網路架構管理 / NAS 異地備份規劃
#NAS實戰日誌 #中小企業IT #PCPiLOT #委外CKO
Comments