解析英特爾技術矩陣,支撐企業AI轉型攻破數據難關

英特爾中國 發佈 2020-04-11T01:57:34+00:00

評估數據:只有高質量的數據才能助力企業實現人工智慧優勢,據 IBM 估計,劣質數據給美國經濟造成的年度損失令人震驚, 高達 3.1 萬億美元。

如何讓疫情的黑天鵝成為發展的新機遇?新冠疫情的突然到來更像是催化劑——將科技轉型這一選擇更快地拉到企業面前。

大浪淘沙,危中蘊機。事實證明,擁有數字底蘊和創新基因的企業在疫情下發展得更快。

人工智慧在助力復工復產的突出表現更是吸引傳統企業更快地擁抱AI。據Gartner 預測,在2021年大約會有 70% 的企業和機構將通過在工作場所中引入人工智慧來提高員工生產力

決心已下,如何尋找部署突破口?

事實上,從對象檢測到自然語言處理 (NLP),不管人工智慧各種用例的差異有多大,它們都有一個共同點:數據。

數據如未來石油,成為產業變革驅動力,企業需要為人工智慧部署做好充足的數據準備。

如今英特爾CPU在計算基礎設施領域的根深蒂固、在AI領域的早早布局,加之幫助企業進行AI轉型實例的長期摸索,形成一套完善的、為AI部署所做的「數據準備」法則


【清查企業數據「存貨」,5大步驟確認數據價值】

在企業真正下決心擁抱人工智慧時,需對自身進行兩大「靈魂拷問」:

現在是否已經到了需要用AI解決問題的時機?

是否針對人工智慧可在哪些方面發揮最大業務價值設定了優先級?


數據是人工智慧的基石之一,那麼針對上述問題企業需要考慮的是:我們是否有完備的數據作為轉型AI支撐?我們最想發揮所持有數據的哪些價值?

據市場研究調查,迄今為止,全球超過一半的數據都在過去兩年產生,僅有不到2%的數據經過了處理和分析。在此背景下,英特爾建議通過五大步驟確定數據價值。

明確數據的位置:在正式部署AI之前,大多數公司的數據廣泛分散在企業各處,且來源各不相同,形成數據孤島,因此必須先找到並清楚了解所有資料庫,並掌握擁有的數據類型。

評估數據:只有高質量的數據才能助力企業實現人工智慧優勢,據 IBM 估計,劣質數據給美國經濟造成的年度損失令人震驚, 高達 3.1 萬億美元。

清理數據:企業中的數據通常不能直接拿來使用,它們的原始狀態都比較雜亂,通常需要對這些數據進行標記並單獨存放。

集中數據:集中數據包括對數據進行標記,人工智慧和機器學習都需要依靠標籤來準確地分析數據並產生洞察。

收集數據:從訓練到自然條件下的持續推理,應確定所有所需的相關數據源。


【風險最小价值最大,通往人工智慧概念驗證的道路】

在確定後數據價值後,下一步的重點就轉移到如何運用人工智慧。

舉棋容易落子難,投入回報比、自身軟硬體基礎能否跟得上等諸多現實問題都在左右企業的AI轉型計劃。其實,這可以藉助概念驗證 (PoC) 相對輕鬆地完成。

概念驗證不但可以成為幫助決策者探索人工智慧影響的寶貴工具,還能實現價值最大化和風險最小化。英特爾提供了如下方法:

第一步,確認機遇:當明確想要通過人工智慧達到何種目標後,才應開始人工智慧概念驗證。

第二步,明確問題並分析數據:確認基本目標後,可對手中持有的數據資源進行分析;

第三步,評估商業價值:可以包括準確性、完整性、及時性、規模、兼容性、靈活性和工程設計。

第四步,制定解決方案架構及部署,這將需要一系列技術支持,包括:

l 基礎硬體產品和系統基礎設施

l 面向人工智慧的軟體增強功能,用於驅動基礎設施

l 啟用人工智慧框架,用於支持計劃使用的解決方案

l 虛擬化技術、前端軟體和/或硬體

第五步,縱向擴展概念驗證:在完成第 1 步到第 4 步後,需要依照總體人工智慧策略優化概念驗證,使其發揮預期作用。


【至強集成AI加速,英特爾推出軟硬體結合大禮包】

人工智慧概念驗證的第四步——制定解決方案架構及部署,或許是最令企業頭疼的步驟。

為人工智慧部署做好數據準備過程中,如何尋找到技術支撐成為決定企業擁抱AI效率與效果的重要一步。

英特爾至強處理器作為世界上許多數據中心的基礎,處理著大多數計算機視覺和深度學習推理工作負載。但是,人工智慧應用可以從硬體和軟體優化中進一步受益。

第二代英特爾至強可擴展處理器在軟體優化和硬體指令方面進行了大幅改進,集成英特爾深度學習加速技術,為人工智慧和各類以數據為中心的應用提供了靈活性。

西門子醫療正是利用集成英特爾深度學習加速技術的第二代英特爾至強可擴展處理器,為面向心臟病學的人工智慧加速。

利用英特爾技術優化的人工智慧使心臟 MRI(磁共振成像)的心臟功能量化提速高達 5.5 倍。

此前,為從 CMR 圖像中提取定量測量數據,心臟病專家通常使用手動或半自動的工具。然而,這個步驟不僅十分耗時、容易出錯,而且在解讀圖像時會受到用戶間主觀性的影響。

根據此前的人工智慧概念驗證,西門子醫療對於AI挖掘數據價值的要求則是讓數據更精準,且處理數據更加快速——在臨床工作流程中運用AI絕不能以延遲作為代價

相比於GPU,在處理大量人工智慧工作負載時, 至強可擴展處理器能夠更好地滿足整合人工智慧模型的產品需求。這也使得醫療設備公司能夠以更低的成本向客戶提供人工智慧解決方案,高性能平台功能使他們不再需要專用加速器

心臟 MRI(磁共振成像)的心臟功能量化提速則是得益於英特爾深度學習加速技術帶來的高效低精度卷積、int8 中的有效連接和重採樣操作優化

神經網絡經過訓練,可識別心臟的各個區域。西門子醫療使用OpenVINO™ 工具套件分發版將西門子醫療訓練過的模型從 fp32 量化為 int8,並確保精度不受影響。


至強集成AI加速,健康和生命科學行業可以利用AI來集成和分析大量數據,提高診斷準確性,改善醫療現狀。


【「黑科技」持久內存應運而生,化解數據中心痛點】

為AI部署做好數據準備另一個需要克服的難關是內存問題,隨著算法的發展以及數據的激增,存儲的需求也隨之增加。

存儲技術必須跟上計算技術的發展,更低的延時和更高的安全性也日益成為數據傳輸的剛需。


如今短視頻時代到來,用戶量和短視頻作品數量呈現爆炸式增長,短視頻平台的存儲系統的優化和性能提升,面臨著非常艱巨的挑戰。

國內短視頻領域的領先企業快手,為應對短視頻應用中高吞吐率、大數據量請求應用場景帶來的挑戰,將英特爾傲騰持久內存產品應用於推薦系統和Redis服務。

事實上,快手在推薦系統中採用了計算與存儲分離的架構,存儲型服務為推薦系統中上億規模的用戶畫像、數十億規模的短視頻特徵以及千億規模的排序模型參數提供存儲和實時更新能力。

而傳統的DRAM存在價格昂貴,內容容量規格受限等短板,且存在內存易失性。


而在Redis服務中,英特爾傲騰持久內存大容量的特性,令快手單Redis伺服器內存容量達到了TB級。在滿足性能需求的同時,傲騰持久內存還能幫助快手推薦系統的TCO降低30%。

如今,人工智慧以全新的方式挖掘數據價值,數據的價值也推動著企業創新,實現這些的前提則是認清自身持有的數據價值,做好數據準備。

在如今特殊的背景下,就像英特爾聯合創始人羅伯特.諾伊斯所說得:莫為歷史所羈絆,放手而為創絢爛。


戳下方了解更多

企業IT轉型雲上芯課堂:專業行業應用,技術在線課程

關鍵字: