中科雲達GPU伺服器在深度學習上有極致表現

由中科雲達發佈 2020-01-14T04:32:31+00:00

PC的GPU是熟悉的術語，它是能夠在PC上運行視頻和處理圖像圖像的組件。公司一直致力於為廣大用戶提供GPU高性能計算、深度學習、虛擬化仿真、定製化伺服器、工作站、存儲等軟硬體整體解決方案，並與多家知名技術型領先廠商如超微、英特爾、華碩、英偉達等建立了長期的合作關係。

PC的GPU（圖形處理器單元）是熟悉的術語，它是能夠在PC上運行視頻和處理圖像圖像（如視頻遊戲）的組件。最初作為補充中央處理單元（CPU）的外圍設備已完全重新定位，成為高性能計算，自動駕駛汽車，人工智慧的核心組件,縱橫數據（150cloud.com）今天簡單說一下GPU雲伺服器。

一、GPU和CPU之間有什麼區別？

理解GPU和CPU之間差異的一種簡單方法是比較它們處理任務的方式。一個CPU優化的是其核心數量，有很多的高速緩衝存儲器，可通過同時處理幾個軟體線程使用順序串行方式處理。GPU具有大規模並行架構包括數以千計單元來同時處理多線程更加具有優勢。具有數百個內核的GPU處理數千個線程的能力與單獨的CPU相比，可以將軟體加速100倍。

由於GPU經過高度優化以執行高級計算（例如浮點運算，矩陣運算等），因此它們可以比CPU更有效地執行視頻轉換和後處理等功能。此外，GPU實現了這種加速，同時比CPU具有更高的功耗和成本效益。

二、GPU雲伺服器的應用場景

1、視頻編

視頻編中應用的H264編碼技術，為現今視頻編中應用最為廣泛，最為高效省時、省流量的編碼技術，實現此編碼過程所需要的運算、編碼、壓縮等流程十分複雜，此項技術常用於視頻製作公司、直播平台等，所處視頻流量高並發需要可進行快速、實時編。

而使用GPU雲伺服器可支持H264視頻編技術，可實現在視頻編過程中更加方便快捷無需擔心安全問題的使用方式，是涉及到視頻編的企業與個人用戶的最好選擇。

2、人工智慧

時下最火的科技圈話題可以說就是人工智慧，但是要實現人工智慧，需要兩個核心：首先是足夠強大的庫，其次是足夠強大的計算能力。而在計算能力上，史丹福大學人工智慧實驗室的測試表明，Google中心需要1000台CPU伺服器完成的工作，僅用3台GPU伺服器完全搞定。

這樣的測試可以很明顯的看到GPU在深度學習、機器學習方面的極致表現，在這樣需要超強算力的任務中，GPU雲伺服器對效率的提升目前是無與倫比的。

中科雲達S9220-HGX

實現最大的GPU密度和性能

支持多達16個V100 SXM3 350W GPUs、3TB內存和24個3.5英寸熱插拔硬碟。系統還配備了6個3000W鈦金級冗餘電源，有助於優化功耗、運行時間和適用性。能夠將GPU加速帶到橫向擴展的高性能計算環境，並加快AI培訓、推斷和機器學習工作負載。

人工智慧推理

為滿足快速興起的高吞吐量推理市場（由5G、智能城市和物聯網設備（會產生大量數據，並需要實時決策）等技術推動），提供垂直擴展現代人工智慧技術所需的超高性能。為實現最大的GPU密度和性能，這款10U伺服器支持多達16個V100 SXM3 350W GPUs、三兆字節的內存以及16個熱插拔2.5寸硬碟。該系統還擁有6個3000W鈦級效率冗餘電源，幫助優化電源效率、正常運行時間和可使用性。

人工智慧訓練與高性能計算

隨著高性能計算應用不斷解鎖新的科學洞察，它們的複雜性越來越高。基於NVIDIA HGX-2的全新超級伺服器CloudTA S9220-HGX通過NVIDIA NVLink和NVSwitch™支持16個NVIDIA V100 Tensor Core 32GB GPU，利用超過80000個CUDA核心，提供無與倫比的性能，加速本地和雲端的人工智慧與高性能計算。這個新系統可實現高達2千萬億每秒浮點運算次數(FLOPS)性能，而且只占用10個機架空間。

從計算機的自然語音到自動駕駛汽車，人工智慧的迅速發展已經改變了整個行業。為了實現這些功能，人工智慧模塊的大小和複雜性呈現爆炸式增長。隨著高性能計算應用不斷解鎖新的科學洞察，它們的複雜性也越來越高。基於HGX-2的超級伺服器將為數據中心加速雲端人工智慧和高性能計算提供超級設計。通過精心優化，這款超級伺服器將為快速模型訓練提供最高的計算性能和內存。

中科雲達（北京）科技有限公司成立於2016年，公司位於北京市國際信息產業基地。公司一直致力於為廣大用戶提供GPU高性能計算、深度學習、虛擬化仿真、定製化伺服器、工作站、存儲等軟硬體整體解決方案，並與多家知名技術型領先廠商如超微（Supermicro）、英特爾（Intel）、華碩（ASUS）、英偉達（NVIDIA）等建立了長期的合作關係。