ARM發布Cortex M55內核與Ethos U55 microNPU

cnbeta 發佈 2020-02-11T10:00:58+00:00

Helium特指 M-Profile Vector Extension,屬於 M 系列 CPU 中的新矢量擴展和專用矢量執行單元,使之成為該範圍內首款具有單指令多數據流功能的產品。

近日,ARM 不僅宣布了最新的 Cortex-M 系列內核(最新的 Cortex M55),還引入了Ethos U55 microNPU 等改進。ARM 希望通過新的 IP,於將來幾年內為數十億低功耗嵌入式設備提升機器學習和推理能力,擴展自家產品組合,以滿足新的用例需求。

(題圖 via AnandTech)

過去幾年,機器學習技術的應用已變得相當普及,可見其在廣泛的行業和各種系統中。ARM 認為終端 AI 市場會在未來幾年中迎來爆炸性增長,新 IP 就是為此做準備。

首先介紹下 Cortex-M55,它是與 M33 聯繫更加緊密的新一代 IP,引入了體系架構上的新改進,能夠在機器學習和矢量指令方面實現較大的性能和靈活性改進。

Ethos-U55 是專用的 microNPU 推理加速器,可與 Cortex-M 系列 CPU 結合使用,帶來專門面向於 NPU 的性能與能效提升。

與 Cortex-M 系列內核一樣,Ethos-U55 的空間占用也比較少。至於 Cortex-M55,則是首款具有 Helium / 定製指令能力的 CPU 內核。

Helium 特指 M-Profile Vector Extension(簡稱 MVE),屬於 M 系列 CPU 中的新矢量擴展和專用矢量執行單元,使之成為該範圍內首款具有單指令多數據流(SIMD)功能的產品。

新增功能使得新內核的 DSP 性能提升了 5 倍,結合針對機器學習工作負載的優化指令和 MVE,整體表現可提高至 15 倍。

整體微架構方面,新 IP 算是繼承了 M33 和 µarch 。在頻率提升的加持下,它將標量工作負載的性能提升了大約 20%,具體取決於供應商的配置。

新內核的設計重點,同樣體現在帶寬上。其啟用了需要帶寬的新 MVE 和機器學習工作負載,因此對內存子系統進行了改進,比如 4×32-bit 接口與緊密耦合內存(TCM)。

儘管 ARM 進入 NPU 領域的時間相對較晚,但新推出的 Ethos-U55 microNPU,還是較嵌入式市場有著獨特的意義。與移動 SoC 上更大的 Ethos-N 系列相比,它的面積和功耗要低得多。

Ethos-U55 是一種小型 NPU,可從 32 路擴展到 256 MAC、且需要與 Cortex-M 系列 NPU 耦合。

ARM 未提及微體系架構的主要細節,但可知它是一種非常精簡的設計,注重的是面積和能源效率、具有較小的內存占用量,其中包含我們在 N 系列產品中見到的一些特性,如 Weight Decompression 。

即便如此,它與 N 系列在功能上並沒有太大區別,因為該 IP 已包含 M 系列 CPU 。據說其架構與 NPU 有所不同(與更大的兄弟無關),且是專門為低功耗用例而設計。

就面積大小而言,U55 最小的 32 MAC 實現,約為 M55 的 2 倍。這裡沒有絕對的數字提供,實際上討論的是平方毫米的分數。

與上一代解決方案相比,使用 M55 和 U55 的此類系統,其性能改進意味著相當重要的步進功能提升。與基於 Cortex-M7 的系統相比,ARM 帶來了包含 50 倍的性能提升、以及 25X 的能效改進。

至於新 IP 的可用領域,ARM 展望了各式各樣的嵌入式系統(主要是現有的晶片子系統)。比如在移動設備上,廠商可在手機的指紋傳感器、語音助理(實時監聽指令)、甚至在 RF 系統中(如天線調諧)使用它來優化工作負載。

當今的移動設備中,有數百種 M 系列 CPU 可從機器學習功能中獲益,且其中大多數功能對用戶來說是完全透明的。

目前 ARM 已向主要合作夥伴開放 M55 和 U55 的授權,並將在未來幾個月內向更廣泛的客戶群開放,預計最終產品可在廠商二次開發的兩年後走向市場。

關鍵字: