AMD 3990X詳細評測:真正的發燒級CPU,想要「榨乾」其性能束手無策

與非網 發佈 2020-02-24T18:34:01+00:00

與非網2 月 24 日訊,距 2 月 7 日正式發布 Threadripper 3990X已經過去了一段時間,因為某些原因,我們拿到 U 的時間稍微晚了一些,但事不宜遲,馬上開測吧。

與非網 2 月 24 日訊,距 2 月 7 日正式發布 Threadripper 3990X已經過去了一段時間,因為某些原因,我們拿到 U 的時間稍微晚了一些,但事不宜遲,馬上開測吧。

前排提示:至發稿時可能主板與系統廠商會推出優化版本的 BIOS 或更新補丁,處理器的成績很有可能還會有所提高。

▼Threadripper 3990X:讓你見識什麼叫真正的「發燒級 CPU」

對比一下三款發燒級平台旗艦的規格、再加上與之規格非常相似的 EPYC 7742。

CPU 參數點評:

從規格上看,Threadripper 3990X 與 EPYC 7742 比較相似,同樣基於 7nm ZEN2 架構,同樣為 64 核 128 線程,三緩均為 256MB,都支持 PCIe Gen4。

而不同的地方,就是通道(包括 PCIe 和內存)的數量,內存容量上限與基礎頻率等地方了。至於為什麼做這樣的變動,這就關乎到兩種處理器面對的應用場景需求了。

簡單講講,伺服器通常需要面對大量的並行數據處理情景,比如多虛擬機同時運作,四通道的內存帶寬就可能不夠數量眾多的虛擬機同時使用,PCIe 通道數量同理。

同時,AMD要區分兩款處理器的定位,64 核不能動(因為要進一步拉大 AMD 在 HEDT 平台中的優勢),頻率也要提高(伺服器低頻是為了穩定性,發燒級平台就可以將頻率提高獲得更好性能了),就只能動一下上述大多數消費者都不會用到的地方了。

3990X 的 CCD 比 3970X 多了 4 個,每個 CCD 對應 8 個核心,之前 EPYC ROME 的官方開蓋圖就展示過,裡面有 9 片 DIE,真是佩服這種封裝方式。

說回大家關心的價格,29999 元,看著很多錢,不過仔細算一筆帳其實還不算很貴。

EPYC 7742:64 核,48529 元,每個核心 758 元;Threadripper 3990X:64 核,29999 元,每個核心 468 元。

Xeon Platinum 8280:28 核,10009 美元,每個核心 2497 元;i9-10980XE:18 核,12999 元,每個核心 722 元。

這樣看來 AMD 這邊的每個核心性價比要比 Intel 高很多。

說實話,這回 AMD 真的有點要抹殺對手的感覺了,核心數量比 Intel 多,每個核心的價格賣得還便宜(由於沒有相同核心的產品來對比,所以沒法斷定 Intel 的 64 核會賣多少)。甚至有可能會升級成理財產品,畢竟市面上就這一家賣 64 核,萬一沒貨了還會給人炒高價格。

說了一堆,也是時候上菜了。

評測項目簡介

一、傳統軟體性能測試:本項綜合傳統跑分軟體與一些對內存容量不敏感的軟體進行對比,如 CPU-Z,CineBench R15、R20 等。該項會使用幻光戟與皇家戟內存搭建四通道,共 32GB,顆粒均為三星 B-Die,頻率時序 3200MHz C14-14-14-34。

二、生產力性能測試:本次測試加入 PR、AE 與 AME 導出視頻速度的對比。該項會將四種內存混搭湊成 96GB 總容量,為確保兼容性,頻率時序為默認 2133MHz C15-15-15-36。

三、發熱與功耗測試:TDP 280W?不存在的,開 PBO 解鎖高頻才是這塊 CPU 的正確打開方式,我們來看看 64 核能不能讓電錶倒轉?

四、娛樂測試環節:針對這款稀有物種,我們也想到了各種辦法去折騰它,榨乾它的性能。

下一頁會詳細講解本次的測試平台配置,想看數據的朋友可以直接跳到第三頁開始。

測試前的平台介紹

不用測都可以猜到,Threadripper 3990X 單靠核心數就已經可以手撕絕大部分的處理器,包括英特爾的伺服器 CPU 至強鉑金,所以理論上我們要拿出兩邊陣營最強的處理器來進行對比。

但比較遺憾的是,我們弄不到雙路 C621 和兩塊至強 8280,也搞不到 EPYC 7742(買不起 ...)所以我們只能選擇兩邊陣營均比較高端的發燒級處理器進行對比,大家都是 HEDT 平台處理器的最高端型號,應該還是有代表性的。另外我們還會加上 Ryzen 5 3500X 來代表主流處理器的水平,看看這些很多人都買不起的怪物與平時用的 CPU 差距有多大。

說配置之前,也介紹一下我們的測試系統。

最近看了很多新聞,外媒 Anandtech 在測試 Threadripper 3990X 時出現了 Windows 10 系統下 CPU 規格識別錯誤的問題,大致意思就是家用 Windows 10 系統(Windows 10 Pro 或更低版本)不能將 Threadripper 3990X 識別為完整的一顆 CPU,而會將它分成兩塊獨立的 64 線程 CPU。AMD 建議是,安裝 Windows 10 Pro Workstation 或者 Windows 10 Enterprise。

我們也遵循建議安裝了 Windows 10 Pro Workstation 進行測試,在任務管理器中,系統也成功識別出為 1 個處理器而不是雙路。

通過上面任務管理器的邏輯線程數也可以看到,Pro Workstation 是可以支持這款 64 核怪物的,但首要條件是需要安裝上最新版本與補丁,我們的補丁也是當天最新的版本了。

講回配置,平台主板這次選用了技嘉 TRX40 AORUS XTREME,為該品牌最強的 TRX40 晶片組主板。

供電方案升級,16 相英飛凌直出式供電,每相提供 90A 的負載能力,足以應付瞬時負載極高產生大量功耗的的 Threadripper 3990X。

散熱部分裝載了高密度的散熱鰭片,提供更大的散熱面積,加上 8mm 熱管為供電模組散熱,熱管連接了 I/O 裝甲與供電模塊,提高了散熱鰭片的利用率,如果它壓制 Threadripper 3990X 都有問題,那可能就沒有主板能駕馭這顆 U 了。

隨板附送的 AIC SSD 擴展卡

擴展卡的設計很有質感,體現了技嘉最高端主板的誠意,整個金屬片用料厚實,即使 4 個 PCIe 4.0 SSD 同時運行,也能有效地把熱量帶走。

簡單拆解,內置 4 個 NVMe M.2 接口,最高支持 4 塊 PCIe Gen4 SSD 組建陣列。可惜目前手上沒有 4 片高端的 NVMe SSD,之後如果能湊出來的話,一定要 Raid 一個試試。

電源選用了鑫谷崑崙的 1080W,本應打算用 1600W 的電源,奈何手上沒有這麼高功率的電源。在之前某韓國博主評測這塊 CPU 時瞬時功耗曾達到 800W,所以用 1080W 應該沒什麼問題。

內存則是芝奇的兩根幻光戟與兩根皇家戟為主。

超頻三凌鏡 GI-CX360 一體式水冷散熱器

它應該是評測室里比較好的一體式水冷了,能支持 TDP 350W 的處理器,就是說滿載的情況下可以壓制更高頻率的 Threadripper 3990X(默認全核 2.9GHz,TDP 是 280W)。

我們想過拆了 MOD 主機上的 Bykski 分體 360 冷排來用,但因為冷頭沒有 AMD 扣具,且拆裝要重新注水比較麻煩,就放棄這個想法了。

以下為整套測試的系統設置:

Intel 與 AMD 陣營,電壓設置為 Auto,關閉防掉壓。

Intel 的睿頻,AMD 的 Core Performance Boost 默認自動。AMD 的處理器打開 PBO 選項,Package Power Limit Control 調整為 1000W,Intel 的處理器開放功耗牆。

常規測試項目,使用皇家戟與幻光戟組四通道,調整內存頻率時序為 3200MHz C14-14-14-34。

生產力測試項目,內存插滿,頻率默認 2133MHz。

想詳細看每項測試結果的可以看下一頁,如果不想看囉嗦直接看結論可以跳到最後一頁。

傳統軟體性能測試

理論性能測試會簡單粗暴的通過跑分軟體對比處理器之間的算力差距,不同處理器之間的單線程與多線程的性能差距都能通過該測試反饋出來。

為了讓大家對這種超級多核怪獸的測試數據有更直觀的理解,我們加入了一款 AMD 中端級別的處理器 Ryzen 5 3500X,請往下看吧。

CPU-Z

TR 3990X 的 CPU-Z 成績繼 TR 3970X 之後,又創下了新的 PConline 評測室歷史記錄,將近三萬分,是 i9-10980XE 的三倍!比 TR 3970X 也要高出近一萬分。

單線程分數,由於 BOOST 頻率有 4.3GHz,TR 3990X 的單線程跑分也比較高,有 520 分,已經接近高頻遊戲處理器的水準了。

CineBench R15

跑 CineBench R15 的時候,我感覺這不是在渲染,而是在雙擊打開一張圖片:僅僅幾秒鐘的時間就已經跑完測試。

TR 3990X 以高達 12775 分的超高分數秒殺 i9-10980XE,也是後者 3 倍的性能。

單線程方面,TR 3990X 也是略微落後於其餘兩款 CPU,但基本上都是相近的水準了。

CineBench R20

CineBench R20 的分數也同樣震撼,十幾秒就渲染完畢。

TR 3990X 在 CineBench R20 中跑出了三萬的高分,是 i9-10980XE 的三倍有多。

測試期間記錄了各 CPU 的頻率情況,核心數最少的 Ryzen 5 3500X 的全核加速頻率最高,其次就是 Threadripper 3970X,單核則是 i9-10980XE 拔下頭籌。

因為 CineBench R20 對 Threadripper 3990X 來說,負載較小,在溫度還沒跑起來,就已經跑完測試,測得最低全核頻率為 3.75GHz,對於 64 核怪獸來說,這頻率也很高了。

前三項測試的綜合性能對比

小結:到這裡為止,三項測試均可以吃滿 Threadripper 3990X 的多核心性能,性能表現符合預期情況。在面對較短時間的高負載,Threadripper 3990X 不會產生幅度太大的降頻,所以可以很高效的跑完測試。

由於 64 核 128 線程確實是比軟體系統超前了許多,很多軟體都未能對 128 線程進行優化,也就會出現處理器利用率不高的情況,下面抽取了幾款比較有代表性的軟體。

X264 FHD Benchmark

X264 Benchmark 不能跑滿 CPU 所有核心,核心占用比較分散。

7-Zip 基準測試(字典 64MB)

7-Zip 能識別 128 線程,但只能調用 64 個線程

7-Zip 雖然能支持(識別)128 線程,軟體左下角也能認出 64 128T,但後面斜槓的線程數也反映出問題:只調用到 64 個線程,就算自己選擇 128 線程也無濟於事。

3DMark Time Spy Extreme

UL Benchmark 之前有講過,Time Spy Extreme 是能支持 8 核以上的處理器,最高到 64 線程(也就是 128 的一半)。

但實測了一下發現也只是發揮了 64 線程的性能。

小結:目前多核心處理器依然面對著軟體多核優化差的問題,這種情況只能靜待軟體廠商進行適配優化,畢竟這款 64 核怪物推出得比較突然,軟體廠商可能也在加班加點更新軟體了。另一方面,這也許也要 AMD 主動去推進這一塊的生態發展,畢竟超高線程處理器的市占率也不會很高,軟體廠商自發的動力也許不會太強。

生產力性能測試

生產力測試會選取 Adobe 全家桶中的三款軟體:Premiere Pro(以下簡稱 PR)、After Effect(以下簡稱 AE)與 Media Encoder(以下簡稱 ME),使用 4K 與 8K 素材測試渲染導出速度。

上次借來測試的 4 根美光 32GB 內存還回去了,所以只能湊出 4 根 8GB 與 4 根 16GB 內存混插達到 96GB 總內存容量,為了穩定,頻率默認 2133MHz。

4K 與 8K 素材是從 RED Digital 官網下載的樣片,電影機買不起,樣片還是能看看的。

PR 導出

PR 導出,幾款處理器的占用率都比較低,Threadripper 3990X 與 Threadripper 3970X 時長差不多。結論就是 PR 對多線程處理器的優化也是有限。

AE 導出

AE 導出,CPU 占用率同樣很低,這裡 Threadripper 3990X 反而不敵 Threadripper 3970X,i9-10980XE 速度要慢不少。

ME 導出 PR 工程

可以看到核心占用率依然不高,按 25%占用率算,就是 16 個線程,所以有 100 多個線程是沒能被利用上的。

用 Media Encoder 導出 PR 序列與之前直接用 PR 導出的結果比較相近,兩顆撕裂者強於 i9。

ME 導出 AE 序列

而導出 AE 序列,結果就變得非常離奇了,i9-10980XE 導出 8K 的時間變成了三位數,Threadripper 3990X 反手秒了 Threadripper 3970X,多核的優勢似乎又出現了,真是離奇。

小結:Adobe 迷惑行為,吃不滿核心就算了,用 Media Encoder 還比 AE 慢了這麼多,說它毒瘤不是沒有原因的。

SPECworkstation 3 Media and Entertainment 測試

運行了 SPECworkstation 3 中的部分測試,這幾個 Media and Entertainment 項目代表的是實時渲染能力,它對多核心多線程的優化很不錯,所以 3990X 也一枝獨秀,綜合比 10980XE 強 60%。

發熱與功耗測試

該項會測試 Prime 95 滿載 10 分鐘的功耗溫度與待機功耗溫度。

看著 Threadripper 3990X 的滿載功耗好像也沒多高,才 600W?你需要看看下面這張圖。

測試開啟的瞬間,會因為全核處於高頻滿載的情況,功耗會瞬間飆升至 1000W,已經逼近我們電源的額定功率了。

然後隨著溫度的提高,頻率略微下降然後穩定在 600 多瓦,所以全核滿載的功耗還是挺驚人的,請使用 3990X 處理器的用戶務必配一塊供電優秀的主板,電源也建議 1200W 起步了,畢竟還要留一些給顯卡。

關於超頻:我就不太建議大家超頻用了,除非是要用它來打破各種世界記錄挑戰極限的。64 核的基礎上,TR 3990X 的默認頻率其實已經算是很高了。

溫度方面則還是三代銳龍的老樣子,95 度撞牆然後降頻。Threadripper 3990X 待機情況下頻率降得比較低,在待機時還是比較涼快的。

這裡也記錄了全核烤機 10 分鐘後處理器的頻率,Threadripper 3990X 全核頻率降至 3.075GHz,比默認的 2.9GHz 要高一點,也說明我們首測用的技嘉 TRX40 AORUS XTREME 主板性能和品質是真的很好了。

娛樂測試環節

我就想看看除了跑分與壓力測試之外,怎樣才能用滿這顆處理器。

Chrome 瀏覽器網頁多開

Chrome 瀏覽器有著強勁的插件擴展能力,使用便捷,但一直以來都被人詬病非常占資源,讓人又愛又恨,簡直是「毒瘤」一般的存在。

批處理命令可指定打開標籤頁的數量

測試中,僅僅打開 100 個網站(太平洋主頁,B 站等),均會出現絕大部分頁面崩潰的情況,並不能確保正常使用,之後我們改用空白頁測試。

打開 1000 個頁面

打開 1000 個空白頁壓力很小,而且只有打開過程中會占用少許 CPU 資源,全部打開完畢後 CPU 幾乎沒有占用。

打開 5000 個頁面

之後我們直接將數量加到 5000 個,這次連崩潰都懶得崩潰了,Chrome 直接假死,等待 10 分鐘後沒有起色,估計是涼了。CPU 占用 2.6%,內存吃了 8.6GB。

Chrome 是不折不扣的內存殺手,開更多的頁面只會吃掉更多的內存。至於 CPU,只有動畫與視頻才能讓它動一動,但實際情況是頁面還沒加載出動畫,瀏覽器就崩掉了。

VMware 虛擬機多開

虛擬機安裝上 Windows 10 Home 64 位版本,每台機分配 2GB 內存,2 個 CPU 核心,全部打開 Prime 95 烤機滿載。

這裡總共打開了 24 台虛擬機,全滿載的情況下主機就只剩下 36GB 內存,但 CPU 占用還剩 50%。

我想在沒有用完 CPU 時,內存就先爆掉了。

娛樂大師

這應該是這次測試中最有意思的項目了……魯大師竟然能完全吃滿全部 64 核心 /128 線程。

快十年不用魯大師了,我對魯大師的分數早已沒有概念。但我知道每次跑分都會出現無法擊敗的 1%用戶,即使我這次跑出了全排行榜第一的分數。

主機總分榜,依然排在第一名的位置,下面還有另一個兄弟也用 Threadripper 3990X 跑了魯大師,不過顯示成了雙路,估計也是出現了系統不能識別多核心的問題。

多開剪輯渲染軟體

有網友想看 8 開 PR,結果 PR 2020 版已經不能在啟動代碼中加 -m 來多開了,這裡就把 AE,PR 與 AME 同時渲染看看是什麼效果。

相比之前單軟體渲染,CPU 的占用率有了提升,不過也只吃了 50%,還剩下 32 個核心可以用,這怎麼行?

最後,全部一起上……

之後我們加上了 7-Zip 壓縮兩個大文件夾並同時打開三個軟體渲染,這次終於吃滿 CPU 核心,占用率非常接近 100%,不過都是給 7-Zip 吃掉的……

小結:真的要用滿這顆 CPU,對很多人來說都不可能,除非你是包辦了所有後期工作的剪輯師或者是做大數據處理。但也同時說明,它的性能是非常富餘的,即使未來軟體繼續升級,會占用更多的硬體資源,3990X 給你預留了可能 3-5 年的升級空間。

PConline 評測室總結

平時主力寫文章,偶爾剪剪視頻修修圖,下班回家就臭打遊戲的超大陸,真的想不出還有什麼辦法來榨乾 3990X 的性能了。

CPU-Z、R15、R20 三項軟體都能完整運用上 64 核 /128 線程的優勢,Threadripper 3990X 也與另外兩款處理器拉開了很大的差距。

但在面對優化不太好的軟體時,Threadripper 即使只吃到 64 線程,也能發揮出相當於 Threadripper 3970X 的性能。

它確實非常強,一般人用不完的核心數,以及不低的 BOOST 頻率,無論幹活還是玩遊戲,它都沒問題。

但我猜在座的各位,有很多人都不知道自己有沒有多核心的使用需求,或者直接點,不知道多核心處理器能不能幫你賺更多的錢。

它更多的是面向專業用戶的,就是自己的賺錢能力與電腦性能是相掛鈎的。

▼搶先桌面端 64 核,意味著什麼?

AMD 搶先完成了桌面端 64 核心的成就,對個人用戶、工作室或是企業用戶都是一個非常大的利好消息。

對個人用戶來說,AMD 以 64 核自證,意味著它的技術能力已經到達一個新的巔峰,就會給人們留下一個好印象。反映至消費級市場,人們會更加願意信賴 AMD 的產品,從而提高產品的聲量與銷量。

對專業的視頻 / 媒體 / 實驗等等的工作室來說,CPU 強則意味著單位時間內能產出更多作品、計算出更多的數據,獲得更多的收入。Threadripper 系列的高性價比給很多資金不算充裕的工作室提供了新的選擇。大型工作室也可以藉這款 CPU 放棄以前搭建渲染伺服器的方案,人手配備一台 64 核主機,走到哪都是高性能渲染工作站。

而對於企業用戶來說,根據上面 AMD 展示的 KEYNOTE,單路 3990X 處理器的性能已經比對手雙路至強 8280 要強,價格也低上許多,但可惜我們並沒有實測過雙路 8280 的性能,但這個結論應該是八九不離十的。

綜合成本考慮,企業即使不滿足 Threadripper 3990X 的帶寬通道數,他們也可以去選擇「滿血」的 EPYC 霄龍,EPYC 7742 只賣 6950 美元,比雙路至強 8280 的兩萬美元便宜了不少。

今年台北電腦展,AMD 會發布 Zen 2+的新一代處理器,號稱將會繼續提高 IPC 性能。不過我們可能只有在更新製程時才能看到核心數再翻倍了,畢竟現在的 7nm 還有很大的 IPC 提升空間,或許不用很久就能看到 AMD 銳龍頻率趕上對手了?

▼你能用完它的 64 核心嗎——

假如你對 3990X 有興趣,花三萬塊,你能用它來幹什麼?能發揮出它幾成的能力?

以下假設這些能回本的操作:

打遊戲的,玩遊戲用 8 個核就美滋滋了,結果拿這個 U 開了遊戲工作室做代練,虛擬機多開,一螢幕控制 200 個小號,一個月把成本賺了回來;

跑代碼的程序猿,本來 8 核要跑一個月,現在 64 核可能兩三天就跑完,活做得多工資也高了;

做視頻的,渲染時間縮短了十幾倍,本來一周只能做兩個視頻,現在每天都能出一個視頻,以量制勝。

但對於 99.99%的吃瓜看熱鬧用戶來說,應該都是用不完它的性能的,所以你們就來看熱鬧了。

這次測試沒辦法測完的 SPECworkstation,就有一項是測試 Python 編譯代碼的,能比較科學的說明問題。

超大陸一大早回來就開著軟體跑測試,中午吃完飯回來一看還沒運行完,打開任務管理器發現就只吃了一個線程,頓時吐出一口老血。

等了半天終於跑完這項測試,結果下一項測試又出現了上面的情況,只用到了一半的線程。

一核有難,多核圍觀,在 2020 年這情況雖然有所改善,但軟體的優化速度跟不上蘇媽的堆核心速度。

比如我們上面測試到的 Adobe 剪輯導出視頻的三個軟體,少了一半核心的 3970X 在不少項目中都能打平 3990X,換句話而言,對於很多視頻剪輯領域的人來說,3970X 已經夠用了,而且更有性價比。

一句話,你有沒有使用超多核心 CPU 的需求,取決於你的應用領域是否需要到這麼多核心(能不能用到這麼多核心)。

至於你知不知道你領域能不能用到這麼多核心,我這裡也無法明確給出一個參考標準,簡單講幾句吧。

如果是好萊塢級別的大製作,那多核心是非常有必要的,經常高強度同時剪輯跟導出不同的片段,很容易就榨乾它的性能。

如果是需要大量計算數據的情景,比如多線程編譯代碼,那它也是非常合適的選擇。

除此之外,除深度學習之外的大數據處理也非常適合超多核心的 CPU,多 1 個核就是實打實的生產力。

而像超大陸這種平民百姓,拿來跑個分,刷刷排行榜,已經非常知足了。

毫無疑問,AMD ThreadRipper 3990X,會是天梯圖第一的存在,而且看勢頭很可能會是長期霸榜的存在 ...

在被 32 核的 2990WX 和 3990X 連續刷新性能認知之後,我甚至開始幻想 128 核的怪物了 ...

關鍵字: