英特爾:點亮數據中心智能化的「詩與遠方」

英特爾中國 發佈 2020-04-12T19:12:22+00:00

毫無疑問,過去幾年,隨著網際網路和數字經濟的快速崛起,中國的數據中心建設實現了突飛猛進的增長,但傳統數據中心基礎設施高能耗屬性,也給電力、水資源以及土地資源帶來了壓力,這意味著傳統數據中心相對僵化的建設模式、高能耗、高投入的運營方式也走到了刻不容緩的變革階段。

引言:英特爾遙測解決方案,讓數據中心更加綠色,也更加智能。

毫無疑問,過去幾年,隨著網際網路和數字經濟的快速崛起,中國的數據中心建設實現了突飛猛進的增長,但傳統數據中心基礎設施高能耗屬性,也給電力、水資源以及土地資源帶來了壓力,這意味著傳統數據中心相對僵化的建設模式、高能耗、高投入的運營方式也走到了刻不容緩的變革階段。

從這個角度來看,數據中心作為雲服務提供商 (CSP) 業務的核心,未來如何藉助新技術進一步降低數據中心運營成本?如何有效減少能源消耗,打造綠色化、智能化的數據中心?儼然成為了當前CSP亟待解決的難題和挑戰。

數據中心遭遇新挑戰

我們知道,隨著雲計算快速的發展和疊代,一個全面雲化的時代已經來臨,很多企業的應用部署範圍也從傳統的數據中心擴展到到公有雲、混合雲和私有雲的模式,這就迫使「企業上雲」的主要服務商CSP的數據中心,不僅需要進一步優化性能、利用率和功耗,同時還要保持高可用性以及合理的成本,具體來說:

一方面,從能耗角度看,當前無論是CSP的傳統數據中心,還是規劃新的數據中心,都普遍面臨著降低能耗及運營成本的嚴峻挑戰。據統計,一個10MW規模的數據中心其10年運營成本中電費占比超過70%,加上高PUE導致了巨大的電力浪費,僅能耗優化一項,就可以帶來巨大的經濟效益。

另一方面,從運維角度看,隨著CSP投資的大型數據中心越來越大以及邊緣數據中心的數量急劇增加,機房運維難度不斷攀升。然而,由於存在低效性、人員管理的不確定性以及專業人才難獲取等多方面的限制,傳統依賴於人工的管理、運維在智能化趨勢下變得越來越「難以為繼」。

由此可見,未來的CSP數據中心,必須運用新的技術,使其工作狀態、數據能夠獲得可視並且可管理、可應用,構建多數據中心的集中管理、遠程管理、客戶端管理等等,這才會讓數據中心更加綠色,也更加智能。

遙測技術「應運而生」

正是洞察到了數據中心發展過程中面臨的新挑戰和新趨勢,英特爾過去幾年在數據中心領域一直堅持不斷創新,通過打造「量身定製」的解決方案,為CSP構建智能化數據中心打下了堅實的基礎。

一是,在硬體方面,英特爾為CSP提供第二代英特爾至強可擴展處理器,它相比上一代來說在性能上更為出色,能效表現上也更好,同時搭配英特爾傲騰持久內存,也可以實現更高效能、更低能耗。

同時,基於GPU加速的異構計算技術,深度挖掘及調優GPU/FPGA/AI加速晶片的異構加速性能,也能提高數據中心中伺服器的效率,由此實現能耗的降低。英特爾第二代至強可擴展處理器也是業內唯一一款集成人工智慧加速的x86處理器,其針對高性能計算工作負載中大量數據集的分析進行了優化,這樣也就提供了異構環境下的加速性能。

二是,在軟體方面,英特爾為CSP提供了功能強大的遙測技術解決方案,該方案通過英特爾至強可擴展處理器內置的傳感器,可以提供數據來幫助CSP優化利用率、可靠性和功率。同時,方案中其他監控功能還可以監控諸如內存和緩存使用率這樣的性能指標,同時相鄰的存儲和加速器也可以進一步優化數據中心的運行狀況和性能。

與此同時,雖然功率是一個重要的數據中心電源使用效率指標,但溫度也是一個關鍵因素。但往往安裝在伺服器機架上的溫度傳感器,事實上很難提供有關每台伺服器的實時數據。為此,通過英特爾至強可擴展處理器配備的入口、出口和氣流傳感器提供的數據,CSP也獲取有價值的散熱數據。

更重要的是,通過英特爾搭載的出色的可視化工具,CSP也可以設置功率和散熱數據的閾值,從而改善數據中心整體電源使用效率管理,並能進一步降低數據中心運維管理難度和複雜度。

三是,在服務方面,英特爾面向CSP提供了Cloud Insider計劃,在此過程中,英特爾工程師團隊可以與CSP合作夥伴並肩作戰,幫助CSP解決產品配置、解決方案搭建等等軟硬體層面的問題,通過這種緊密合作,英特爾也能夠幫助CSP搭建行業領先的數據中心基礎架構。

例如,英特爾的解決方案架構師和工程師精通英特爾節點管理器技術、智能平台管理接口 (IPMI)、收集器、時間序列資料庫、可視化功能、編排器、容器等,這些專業知識和技能也可以為CSP實時提供有關基礎設施功能、利用率和事件的全面視圖,實現工作負載的完全自動化和編排。

不難發現,藉助英特爾至強可擴展處理器以及功能強大的遙測解決方案,驅動電源管理、散熱管理和工作負載優化,不僅可以增加數據中心正常運行時間、降低總體擁有成本和電源使用效率,也能夠加速推動數據中心朝著智能化的發現發展。

三步走實現創新之旅

客觀的說,CSP要實現數據中心智能化並不是「一蹴而就」的過程,這是因為在數據中心的管理中,發現並彌補工具缺口然後再開始收集遙測數據已經是一項非常艱巨的任務,同時還要妥善使用數據,並使遙測解決方案能從幾個節點擴展到數千個節點,更是難上加難,此外功率和散熱的關聯性也讓問題變得更加複雜。

基於此,英特爾給出的建議是,通過「三步走」的方式就能完成數據中心智能化的創新之旅,具體來說:

首先,CSP要實現數據中心基礎設施的現代化和智能化,首當其衝的就是要學習如何將數據中心內已經存在的遙測功能公開給一個或多個數據中心管理工具。然後,與遙測數據進行互動以採取措施,從而逐步提高遙測技術的成熟度。

其次,使用數據分析實現自動監控和操作,英特爾遙測技術帶來的好處就是,可以收集到大量的數據,因此CSP基於數據分析顯然能為及早發現問題並儘早採取措施提供支持。比如,CSP的管理和運維工程師可以在伺服器性能開始下降時立即轉移工作負載,或在察覺到氣候變化時自動調整數據中心的冷卻設備。依靠遙測數據,CSP真正可以完成預防性維護,從而縮短故障時間、降低緊急情況出現的頻率並提高數據中心的效率。

最後,英特爾建議CSP引入機器學習和人工智慧來打造真正自治、自我監控和自我修復的數據中心,同時優化電源使用效率和總體擁有成本。在這方面,英特爾至強可擴展處理器作為實現人工智慧的基石,也一直在不斷提升人工智慧訓練和推理性能。據今年年初英特爾在CES 2020上宣布的,英特爾即將於今年推出的第三代英特爾至強可擴展處理器(代號Cooper Lake),將包含面向集成人工智慧訓練加速的全新英特爾DL Boost擴展指令集,與之前的產品系列相比,其訓練性能大幅提升。

值得一提的是,英特爾還提供了一個參考架構,讓CSP也可以輕鬆地將人工智慧功能添加到自己的雲堆棧中,讓AI的性能得以增強,由此更好的幫助CSP打造差異化的競爭力,並將人工智慧的價值發揮到最大化。

例如,新華三通過引入第二代英特爾至強可擴展處理器,不僅為其先知網絡架構(SNA)輸出強大的算力支持,更結合新架構在不同應用場景中的需求,為其AI訓練和推理過程提供多種優化的AI方案,而來自驗證性測試的結果也表明:因為英特爾至強平台集成AI加速能力,基於該平台的SNA具有很強的AI訓練能力,並在最終用戶的實際部署中贏得了良好的反響。

全文總結,目前數據中心的發展正進入關鍵階段,特別是未來CSP的數據中心基礎設施建設,一定需要適應智能化、高密度,低PUE值的嚴格要求,由此才能真正讓數據中心實現創新發展。在此過程中,英特爾通過技術和解決方案的不斷創新,以及對CSP提供的「量身定製」的服務,將為數據中心智能化、智慧化的發展持續貢獻更高的價值,並點亮數據中心未來的「詩與遠方」。


戳下方了解更多

企業IT轉型雲上芯課堂:專業行業應用,技術在線課程

關鍵字: