機器學習如何推動數據中心發展?

cda數據分析師 發佈 2020-01-16T20:41:00+00:00

作者| CDA數據分析師1、前言大數據革命引發了數據中心的爆炸式增長,這些中心正在以越來越高的速率消耗能源。本文回顧了兩種提高數據中心效率的標準方法,並認為第三種方法-機器學習-是最佳解決方案。天網,VIKI和HAL 9000就是一些具有機器學習功能的AI的例子。創建它們的目的是

作者 | CDA數據分析師

1、前言

大數據革命引發了數據中心的爆炸式增長,這些中心正在以越來越高的速率消耗能源。本文回顧了兩種提高數據中心效率的標準方法,並認為第三種方法-機器學習-是最佳解決方案。

天網,VIKI和HAL 9000就是一些具有機器學習功能的AI的例子。創建它們的目的是解決對人類而言過於複雜的問題,並通過神經網絡對其進行控制,以提高效率,安全性和成功率。當然,電影需要對立面,因此這些AI奇蹟給了不利的黑暗面——但是這種複雜的機器學習是真實的並且已經成功實現。

自2000年代以來,數據中心已經激增。一個大型電子商務服務數據中心僅用幾個19英寸機架來部署所需的伺服器,存儲器,以及網絡設備。如今,超大型數據中心成千上萬的硬體設備部署在數千個機架上。它們源自本地辦公室的小型伺服器,現已發展成為超大型設施,以維護我們的物聯網和所有相關數據。美國人使用的數據,流程,連接性和存儲量需要大量電力,這意味著數據中心是主要的能源消耗者。占全國年用電量2%的行業和政府專家正致力於提高效率,因為預計數據中心的需求將會增加。

目前,解決此問題的方案主要有兩個方面:

  • 他們必須使舊的數據中心儘可能高效
  • 他們必須建立更高效,更大的數據中心

但是,它並沒有確定解決此困難的解決方案。而真正的解決方案在於實現機器學習系統。通過它們的過程,可以減少數據中心的能耗,並使其效率比以前更高。如今,部署依賴於機器學習的工具的數據中心運營商正在從效率和可靠性方面獲得最初的收益,但他們才剛剛開始摸索機器學習將對數據中心管理產生的全部影響。

機器學習是人工智慧的子集,有望優化未來數據中心運營的各個方面,包括計劃和設計,管理IT工作負載,確保正常運行時間以及控制成本。IDC預測,到2022年,由於具有嵌入式AI功能,數據中心中50%的IT資產將能夠自主運行。

2、數據中心能耗

容納大量伺服器場的大型,不起眼的容納器慢慢地在美國興起。這是全球性現象,因為數據和信息都以數字方式存儲,因此需要空間。由於節省了大量資金,我們對人類的模式和趨勢有了更複雜的了解。不幸的是,將數據存儲在伺服器中並不像一個庫。他們需要恆定的功率來產生熱量,並且熱量需要被冷卻,從而消耗更多的能量。

2014年,僅美國數據中心就使用了約700億度電,從這個角度來看,1 kWh將使智慧型手機充電一年。需要能源以保持數據中心24/7全天候運行,使用大量的冷卻系統進行冷卻以及在緊急情況下維持冗餘電源。也就是說每年維護在大約七十億美元,能源成本影響著每一個人。消費者,資料庫提供者和環境都感受到了如此大量能源消耗的後果,但我們的利用率沒有絲毫放緩的跡象。因此,利用和能源效率是適應的主要目標。

美國至少有300萬個數據中心,足以容納該國每100個人中的一個。數據中心的增長非常複雜,大多數伺服器和相關設備都是在2000年至2010年期間購買的。但是,隨著伺服器空間使用效率的提高和對大型數據中心的依賴性增加,統計數據表明存儲量將適應而不是增加。

3、能源效率,更好的建築計劃和機器學習

有些人可能認為辦公伺服器比新的超大規模數據中心更有效率。或在破土動工並不必要地淘汰它們之前,應使用較舊的就地數據中心。這些想法有邏輯上的支持,獨立伺服器由其所有者處理,並且回收而不是更換,但是它們實際上並不起作用。現場伺服器需要數據中心做的所有事情,因此公司在自己的伺服器場上花費更多的錢,而不是使用遠程中心所需的確切空間。而且,較舊的數據中心在構建時就沒有考慮能源效率,因此,即使是看似新的數據中心也可能已過時。

美國能源部鼓勵大規模實施能源效率。他們的「更好的建築」計劃邀請企業和數據中心減少能耗或使用可再生能源。諸如Google之類的大型科技公司率先採用了這種方式,通過機器學習系統來減少其數據中心的能耗。

4、DeepMind –面向數據中心和未來的機器學習

機器學習是AI的過程,能夠從場景中學習並做出反應,而不是通過編程的選項做出響應。機器學習系統會獲得歷史數據,參數(目標),並通過模仿我們自己大腦功能的神經網絡進行操作。它們非常適合數據中心,這些數據中心對於以前的系統和專業人員來說已經變得複雜起來,無法有效地進行管理。數據中心每天都會發生近十億次事件,只有通過直觀的系統才能處理這些事件,以實現最大的可操作性。例如:

  • 設備-設備/人員-人員的交互對於每個中心和日常事件都是唯一的
  • 傳統的系統和人員無法迅速適應導致重大能量損失的內部/外部微小環境變化

Google通過輸入DeepMind系統,希望將其能降低和保持40%的能源效率,這是一個通用系統,他們希望廣泛發布以減少能源使用。Google數據中心團隊針對某些操作場景對DeepMind進行了培訓,創建了自適應參數,輸入了歷史數據(例如溫度和泵速),並將目標定位為未來的電源使用效率(PUE)。PUE實際上是建築能耗與IT能耗之比;用於衡量能源效率。

當部署在Google的數據中心時,它可以通過分析難以理解的數據集並建議採取的措施來成功地減少能耗。這聽起來與最初提到的AI所承擔的任務相差不遠。幸運的是,科幻小說與科學之間有清晰的界線。諸如DeepMind之類的系統是一項優勢,能夠以人類無法掌握的規模降低能耗。隨著時間的流逝,更多的系統將實施機器學習,以便它們可以最大限度地提高可操作性,從而為人們節省金錢,更重要的是,為環境節省了資金。

Uptime Institute研究副總裁Rhonda Ascierto說:「這是數據中心管理的未來,但我們仍處於早期階段。」IDC Cloud to Edge數據中心趨勢服務研究總監Jennifer Cooke表示,隨著越來越多的公司採用包含雲,託管設施和內部數據中心的混合環境,並且將越來越多地包括邊緣站點,創建更智能的數據中心變得越來越重要。

5、機器學習在數據中心的應用

何為機器學習?簡單來說,機器學習是從例子和經驗(即數據集)學習而不是依賴於硬編碼和預定義規則的算法。換句話說,不是開發者告訴程序如何區分蘋果和橙子,算法被數據「訓練」並且自己學習如何區分蘋果和橙子。以下是當今數據中心管理中機器學習的五個最大用例:

5.1 效率分析

Ascierto說,當今的組織正在使用機器學習來提高能源效率,主要是通過監視溫度和調整冷卻系統來實現的。

例如,谷歌在今年早些時候曾發布,它正在使用AI通過分析21個變量來自動管理和優化其數據中心的冷卻,例如外部氣溫,數據中心的功率負載以及後方的氣壓。發出熱氣的伺服器。該公司表示,Google的機器學習算法可實時自動連續不斷地調整冷卻裝置的設置,從而使冷卻每年的能源使用量減少30%。

此外,它可以就設計或配置數據中心的最有效方法(包括IT設備或工作負載的最佳物理位置)提出建議。

5.2 能力計劃

機器學習可以幫助IT組織預測需求,因此它們不會耗盡電力,冷卻,IT資源和空間。例如,如果一家公司正在整合數據中心並將應用程式和數據遷移到中央數據中心,則算法可以幫助其確定此舉如何影響該設施的容量,Ascierto說。

DCIM軟體供應商Nlyte Software的首席戰略官Enzo Greco說,容量規劃是組織建立新數據中心的一項重要服務,該公司最近推出了數據中心管理即服(DMaaS)產品,並與IBM Watson合作對其進行了集成。將機器學習功能納入其產品。

「您需要使數據中心儘可能準確。您需要多少台伺服器?您需要多少冷卻?您只需要與伺服器數量一樣多的散熱。」他說。「此外,您需要多少電量?這取決於散熱和伺服器容量。」

5.3 風險分析

在所有用例中,使用機器學習進行風險分析是最關鍵的,因為它可以識別異常並幫助防止停機。「機器可以檢測出異常,否則將無法發現,」 Ascierto說。

例如,施耐德電氣的DMaaS可以分析來自關鍵數據中心設備(例如電源管理和冷卻系統)的性能數據,並預測何時可能出現故障。施耐德電氣數據中心解決方案架構師副總裁Joe Reele說,當算法檢測到異常現象時,系統會警告客戶,以便他們能夠在設備出現故障之前進行故障排除。

5.4 客戶流失分析

將來,Ascierto看到託管服務提供商使用機器學習來更好地了解他們的客戶並預測他們的行為-從購買或添加新服務到續訂合同甚至支付帳單的可能性。她說,這是客戶關係管理的擴展,可以包括通過聊天框自動進行客戶互動。

Maya HTT已經分析了客戶情緒。Duquette說,它目前沒有數據中心客戶使用它,但是通過自然語言處理,該公司的軟體可以分析電子郵件並記錄支持電話以預測未來的客戶行為。

5.5 預算影響分析與建模

Ascierto說,這將數據中心的運營和性能數據與財務數據(甚至包括適用稅項在內)混合在一起,以了解購買和維護IT設備的成本。她說:「它模擬了一件設備的總擁有成本和整個生命周期,例如一種冷卻系統與另一種冷卻系統相比。」

例如,Salesforce在2016年收購了一家名為Coolan的初創公司,該公司使用機器學習來分析IT設備的總體擁有成本,直至單個伺服器組件。問題是越來越多的公司將使用機器學習進行預算影響分析的時間。一些私人公司可能會自己做,但是這很複雜,因為它要求以計算機模型可以提取的格式容易獲得財務數據。

出於安全原因,DMaaS客戶不太可能希望與第三方共享其財務數據。她說:「對於DMaaS服務,在早期,讓客戶共享他們的財務數據是一個比較棘手的提議。」

這個領域還不成熟,但發展速度很快。人工智慧系統正式交付使用還將需要一定的時間,就像數據中心招募的新的工作人員一樣,不過類似的機器學習工具終將可以真正的幫助您運營數據中心。


關鍵字: