2015年8月12日 星期三

PC與SERVER的異同

PC與SERVER的異同
文章出處
http://ithelp.ithome.com.tw/question/10062091

任務特性不同
PC (Desktop/NB) 是給個人用的, 出再多問題, 影響的也只是使用的「一個人」而已;
Server 是給一群人用的, 少則數十人, 多則成千上百, 甚至幾十萬人, 稍有閃失, 影響層面難以估計.

PC 追求個人使用上的聲光效果體驗, 與個性化的自主性
Server 追求高負載的能力和穩定性, 與管理上的便利性

在以下討論前, 我們要先謹記以上的區別, 因為有很多差異, 是基於以上的特性不同而設計出來的.

電源供應器
Server 經常都具備 Redundant Power Supply (雙電源)的規格, 這點幾乎沒有一台 PC 可以達到. 理由當然不用多說, 只要回顧上面所提到的任務特性即知.

我一個客戶的舊 Server 原本只買了一個 Power, 某天這個 Power 故障, 全公司的 ERP 停擺, 生產線完全無法下單生產, 公司從上到下急得不得了, 急 Call 我們要送一個新的過去. 但是再怎麼快, 我們也要協調代理商調貨, 從倉庫出貨, 到我們手上, 再送到位處偏遠地點的工廠所在地, 最快也要耗了半天....

停機半天, 對一般 PC 使用者來說, 根本無關痛癢, 頂多打混半天; 但公司 Server 停半天, 影響的可能是: 幾百萬幾千萬的訂單無法如期交貨, 客戶從此就轉單到別家去; 或是, 業務人員無法立即查詢回覆新客戶正確的交期, 結果本來可以拿到幾百萬的訂單, 只因為別家可以馬上答得出來交期, 我們還要再等半天才知道, 訂單就從業務手上溜走.....

所以, 對某些公司來說, Server 別說是停機半天, 光停機一小時就足夠嚇死人了.

後來我這個客戶又買了四台新的 Server, 這四台通通都配備了雙電源, 以免重蹈覆轍.....

存活能力
從上面電源供應器的例子, 我們可以了解 Server 必須比 PC 有更高的存活能力, 在某些零件故障時, 還能夠繼續運轉下去. 基於這樣的概念, 於是就發展出許多獨門的存活技術.

例如: IBM/HP 的 Server, 可以把記憶體規劃成類似 RAID-1 的 Mirror 架構, 當一排 DIMM 的 RAM 故障時, 系統會自動切換到 Mirror 的那組 DIMM, 繼續工作, 而不會因此停擺. 甚至除了 Mirror 之外, 還可以有第三組 Spare (備用) 的 DIMM, 萬一 Mirror 那組故障, Spare 還可以再接替上去. 這個技術, 在 IBM 稱為 ChipKill, 其他廠商則有他們自己的名稱.

除了記憶體之外, 對於多 CPU 的主機, Server 也可以在一顆 CPU 故障時, 把故障的 CPU 隔離開來, 讓其他的 CPU 繼續運作下去, 雖然效能降低, 但是至少不用停機, 先把重要的事情處理完, 等有空檔再停機下來更換.

網路部分, 現在的 Server 標配都是 2-Port Ethernet 以上, 目的也是為了備援, 不會因為網卡故障而停機, PC 就沒有這樣的需求. 而且 Server 等級的 Ethernet 網卡, 還具備比 PC 更高階的功能, 例如: TOE (TCP/IP Offload Engine) 或是 iSCSI Offload Engine, 利用網卡本身的晶片來計算網路傳輸所需的運算, 減輕由 CPU 計算封包內容的負擔; PC 的網卡幾乎沒有, 也不需要這樣的功能.

硬碟部分, 常見的 RAID 備援當然不能少. 但是 Server 等級的 RAID 也比 PC 要更高級, 跟網卡一樣, 它可以將許多原本需要 CPU 介入的 RAID 運算, 移到 RAID Contoller 上面以硬體晶片來處理, 減輕 CPU 的負擔. 大部分 PC 的 RAID 都是 fake-RAID, 還是需要大量的 CPU 軟體介入處理.

當然, PC 也可以另買高檔 RAID Controller 來插, 但這樣一來, 價格不是也跟 Server 一樣了? 而且這裡又會凸顯出另外一個差異: PCI 擴充槽的數量和速度....

Server 的記憶體, 通常具備 ECC 錯誤修正的能力. 早期的 PC (我是說:很早期...10 幾年前) 也有 ECC 的設計, 但是後來因為成本的競爭劇烈, 且大部分使用 PC 的人, 都不介意少許錯誤的發生 (畫面少幾個點, 少許的顏色跑掉, 聲音錯了幾個 Bits.....誰分得出來啊?), 所以, 後來的 PC 都把 ECC 給拿掉了.

但是 Server 可不能這麼隨便, 試想: 如果有一天, 業務下單了之後, 到了工廠要生產時, 數量欄位上的某個數字突然變了, 卻沒有人知道這件事, 結果生產出來的結果和當初下的單不一樣, 請問這個損失是誰要出來扛? 業務? 還是工廠?.....只是 RAM 裡面的一個資料錯了而已....

所以, ECC RAM 已經是 Server 的標準配備了, 現今沒有一台 Server 級的電腦, 敢不配 ECC RAM 就給客戶使用的. 但是 ECC 也有高低檔之分別, 初級的 ECC 功能, 只能分辨 1 個 bit 的錯誤, 如果同時發生的錯誤多過 1 個以上, 有可能會分辨不出來. 但是像 IBM/HP 等高階品牌的 Server, 都另有高階的 ECC 功能, 可以分辨 1 個 bit 以上的錯誤, 詳細規格及介紹, 各位可以參閱原廠的介紹型錄.

整體效能
PC 玩家常以「超頻」來取得更多的 CPU 效能, 但對於講求「穩定」的 Server 來說, 超頻的風險太大, 通常都以 Multi-way CPU 來解決. PC 鮮少有配備兩顆以上的 CPU 插座(Socket), 但是 Server 除了最低階的機型以外, 中階機型至少配備 2~4 個 CPU 插座, 高階機種則有 8 個以上的 CPU 可以使用.

企業剛買 Server 時, 可能為了經濟性, 只買一顆 CPU; 但日後隨著業務量的增加, 可以只家買 CPU 就能夠提高效能, 而不必為了補充效能的不足, 又另外買一台新的 Server. 這個在企業的財務管理和資產管理方面, 有其必要性.

除了透過 Multi-way SMP CPU 來增加效能之外, Server 所使用的 CPU, 其內的 Core/Cache 數量也比 PC 版本來得多. 這些增加的效能, 都是 PC 等級無法追上的. 除此之外, 還有許多 CPU 技術是 Server 獨有, PC 基於經濟性的考量是沒有的, 這方面的比較, 有請更專業的網友提供兩者的比較.

除了 CPU 的擴充性高以外, I/O 的效能也是需要考量的. PC 雖然也有高效的 PCI-e/PCI-X 擴充介面, 但是其數量可能太少 (只有 1~2 個), 或是等級較低 (PCI-e x1, x2, x4); 但是 Server 的擴充性就大許多 (4~6 個), 而且等級也較高 (PCI-e x4, x8, x16). 有些 PC 雖然具備高效 PCI 插槽, 但是卻被閹割成只能接受某些特定種類的卡 (例如: 繪圖卡), 並不是全面通用的, 所以經常有高階的 PCI 擴充卡(RAID, FC), 插到 PC 上面會出問題, 或是無法使用.

但是相反的, Server 在圖形處理方面, 就不需要具備太多的效能, 因為不可能讓全公司幾十人或幾百人, 都擠在 Server 前面看畫面輸出, 所有資料都是透過網路, 傳輸到 Client 端的 PC 之後再顯示. 所以, Server 的顯示介面, 通常就是標準的 VGA (XVGA) 通常就足夠了, 不需要甚麼 GPU, 2D/3D rendering...這些高階繪圖的功能.

另外一個不需要在 Server 上面出現的, 則是影音呈現的能力, 理由同上. 所以, Server 也不會有甚麼 HDMI, SPDIF, 7 聲道, MPEG 硬壓/解...這些 A/V 功能.

(奇怪, 不是說字數限制已經擴充到一萬字了嗎? 怎麼我的回應還是只能寫一千字?......)

RAID 部分要再補充一下, Server 用的 RAID Card 不是只有單純的 RAID 功能而已, 為了增加效能, 通常還會再加裝 RAID 專用的 Cache, 而且為了安全性, Cache 還可以加裝電池, 也具備電池定期自動充放電的管理功能.

此外, 為了避免單一 RAID Card 故障, 也可以用兩片 RAID Card 組成 HA 架構來備援, 當然, 此時硬碟也必須使用 Dual Port 的硬碟, 一般 PC 的硬碟是無法提供這種備援的.

管理能力
談到管理, 這點就是 PC 望塵莫及的地方了. 大部分的 PC 玩家, 如果沒有在企業環境中長期工作過, 不會覺得管理能力有甚麼了不起的地方.

但是企業的環境多變, 很多狀況下, IT 人員可能無法親自前往 Server 放置的地點操作, 近者也許相差幾層樓, 但偏偏你就是分不開身, 無法走過去; 遠則可能在另外一個城市, 或是另外一個國家, 就算你就空可以去, 所花費的時間和旅行成本, 是企業沉重的負擔.

因此第一個管理能力就因此而誕生: 就是能夠遠端管理 Server 的能力.

IBM/HP/Dell 的 Server, 都可以加買一個 Ethernet 的遠端管理介面, 這個介面類似 IP-KVM 的功能, 基本上, 就是把 Server 的畫面, 透過 Ethernet 網路傳出來, 管理人員在遠端, 只需要使用瀏覽器, 就可以操縱遠端 Server 上的一舉一動.

如果只是這樣的話, 那麼市售的 IP-KVM 就可以解決了, 何必要買原廠的呢?.....(才不呢..)

原廠提供的這個介面通常是用 IPMI 的標準來製作, 它除了可以看到開機之後的畫面以外, 也可以看到開機時的 BIOS 顯示畫面, 以便了解是否有甚麼錯誤....更重要的: 他甚至可以操控 Server 的電源開關!! 你只要在瀏覽器上按鍵, 就可以將 Server 關機; 或是將他開機 (即使 Server 是在關機的狀態, 也可以被從遠端遙控開起來)

此外, 這個遠端管理功能, 還可以將操控端的 CDROM 掛上來, 把她掛載成遠端 Server 可以使用的 CDROM, 因此你不必跑到遠端 Server 去放光碟片, 只要把光碟放在自己的 CDROM 上, 就可以讓遠端 Server, 從這張光碟開機, 安裝作業系統.

第二種管理能力, 就是 Server 能夠做自我診斷, 目前也沒有一台 PC 能做到.
現代的 Server 面板上, 都有一個診斷面板, 上面可以直接顯示故障的硬體種類, 例如: 下面這張圖是 IBM 的 Light-path 面板, 平常是收藏在 Server 裡面, 發生硬體故障時, 把他拉出來看上面的燈號, 就可以知道故障的組件, 回報給原廠客服之後, 馬上會派人來更換:

我有一個客戶, 新買了一台 IBM Server, 用了兩個月, 突然發生系統無故卡死, 必須重開機才能解決. 剛開始以為是作業系統安裝的問題, 但是前面用了兩個月都沒事, 卻在一周內卡死三次; 後來 IT 人員到機房去重開機時, 看到上面那個面板, 亮出橘色的燈號, 標示著: CPU......

客戶打電話給我, 請示該如何排除故障? 我一聽是 CPU 亮燈, 二話不說, 叫客戶馬上 Call IBM. IBM 經過初步的問診之後, 立刻排時間派工程師, 帶一顆 CPU 來更換. 更換之後, 一切恢復正常.

試想, 這個事件, 如果發生在 PC, 你要查多久, 才會懷疑是 CPU 故障?....新買的喔....
有了這個診斷介面, 我連想都不用想, 可以立刻判斷是否需要原廠的維修服務, 省下寶貴的時間.

更有甚者, 某些 Server 打開機殼之後, 在主機板上四處都藏有紅色的 LED, 在故障零件旁邊就會亮起紅燈. 例如: 面板顯示 MEM 故障, 但是記憶體那麼多條, 我哪知是哪一條故障? 此時, 故障的 RAM 旁邊, 會自動亮起紅色的 LED, 打開機殼一看便知, 該換哪一條....

如果是一般 PC, 你豈不是要一條一條換起來試? 如果故障問題是要跑兩三天才會發生一次, 一台插滿 18 條 RAM 的 Server, 你要花幾天去試, 才能抓到故障的組件?

維護保固

Server 還有個很重要的附加價值, 就是原廠的維護服務 (雖然還是要用錢買, 但仍很重要...)

PC 玩家常常對原廠的維護服務嗤之以鼻, 自栩功力高強, 有甚麼硬體維修搞不定的呢? 對呀, 自己修電腦, 東換換西換換, 搞不出來, 還可以去逛逛光華商場, 看看有甚麼新鮮貨可以拿來試試看; 或是掛網上論壇, 與眾網友們切磋討論一番, 打屁哈啦, 最後終於找出病因, 換對了東西, 看著他順利的運轉起來, 心中有多麼大的滿足, 多麼有成就感的一件事情啊!!....

但是, 企業老闆願意讓你花多少時間這樣試? 這樣玩?....通常主機一停擺, 5 分鐘之內就會有員工跳腳, 10 分鐘之內, 你桌上會有接不完的電話鈴聲響起, 這時你是要接電話道歉, 還是不管電話, 繼續修電腦?

30 分鐘之後, 主管開始來關心:「...會不會很難修啊?」; (難修? 當然不會啦, 這一點小問題怎麼難得到我這個高手玩家? 只是要給我一些時間找看看問題....),

2 小時過去了, 你正在滿頭大汗地應付一堆拆散的零件, 這時, 突然業務部主管氣沖沖的衝進來, 用力往桌上一拍:「你到底還要修多久啊!!....國外客戶等我們報價已經等得不耐煩了, 你這個 ERP 不開起來, 我們要怎麼算成本和交期, 給國外客戶報價啊!!」....(你只能臉上三條線)

4 小時過去了, 公司緊急召開一級主管會議, 業務部門在裡面咆哮, 威脅要把你給開除掉....

不管你自己有多麼厲害, 多麼會修電腦, 在企業營運裡面, 千萬不要把這個責任攬到自己身上, 因為修得好只是剛好, 修不好就都是你的錯. 如果你買了原廠保固維護服務, 只要輕鬆地打一通電話給原廠客服, 剩下的就聽他們指令來動作, 如果需要派工到場維修, 你也可以名正言順的告訴公司其他部門:「我們已經報修了喔, 現在只要等工程師來, 在這之前, 都不關我的事.....」



如果公司還抱怨維修太慢, 你還可以反將一軍: 誰叫公司當初不肯花錢買「7x24 四小時到場」服務? 為了省錢只用最低階的 5x8 NBD (隔日到場), 結果你看吧, 現在害到的是你們自己, 要明天才能修好....趁此機會爭取更多的維護預算.



沒有留言:

張貼留言