【原創】史上最強FPGA來了!7nm工藝性能逆天

winniewei 提交于 周三, 03/11/2020
【原創】史上最強FPGA來了!7nm工藝性能逆天

作者:張國斌

今天上午,FPGA發領頭羊賽靈思公司以在線發布形式宣布推出 Versal ACAP 產品組合第三大產品系列—— Versal? Premium,這款FPGA堪稱是史上最強大FPGA,它有高度集成且功耗優化的網絡硬核,是業界帶寬最高、計算密度最高的自適應平臺,主打應用是那些在散熱條件和空間受限的環境下需要運行最高帶寬網絡以及需要可擴展、靈活應變的應用。

圖1全球帶寬最高、計算密度最高的自適應平臺——Versal Premium

圖1全球帶寬最高、計算密度最高的自適應平臺——Versal Premium

ACAP 是賽靈思繼 1984 年發明 FPGA 之后又一顛覆性技術發明。FPGA 曾經被行業列為震撼世界的 25 款芯片之一,而 ACAP 作為一項業界重大技術顛覆,為之前硬件工程師才能受益的靈活應變的 FPGA 走入軟件、科學家等開發者開啟了大門,對當今大數據與人工智能領域的創新具有深遠意義。

ACAP 和?FPGA 一樣是一類器件,而 Versal就是業界首款 ACAP 自適應計算加速平臺。ACAP目前已經發布了兩個系列--分別是 AI Core 系列和 Prime 系列。今天發布的Versal? Premium是ACAP的第三個產品系列。

圖2  Versal? Premium是ACAP的第三個產品系列

圖2??Versal? Premium是ACAP的第三個產品系列

2019年6月,賽靈思首款自適應計算加速平臺(ACAP)——Versal開始向一線客戶出貨,ACAP項目代號“珠穆朗瑪”,是賽靈思公司研發四年投入超過10億美元的成果,該項目出自賽靈思現任CEO Victor Peng 之手,這樣的大手筆投入徹底拉開了賽靈思和當年FPGA二當家Altera(已經被英特爾收購)的差距 。

FPGA是大小還是比強悍?

我經常被問到FPGA的未來發展趨勢是什么??我想應該回歸到FPGA的本質---就是要擁有大量的可編程邏輯資源以及更高的帶寬和速度。一款強大的FPGA必須擁有足夠多的邏輯資源,足夠多的接口、硬核IP以及DSP等資源當然還要有高帶寬。

2019年8月賽靈思公司在總部宣布推出號稱全球最大容量的 FPGA – Virtex UltraScale+ VU19P,VU19P擁有 350 億個晶體管,是當時全球單顆芯片最高邏輯密度和最大I/O 數量的FPGA,它除了可以支持未來最先進 ASIC 和 SoC 技術的仿真與原型設計外,也將廣泛支持測試測量、計算、網絡、航空航天和國防等相關應用。詳見《xilinx推出史上最大FPGA》。

圖3 賽靈思發布Virtex UltraScale+ VU19P

圖3?賽靈思發布Virtex?UltraScale+ VU19P

2019年11月,英特爾(Altera)推出了超過千萬邏輯門擁有433億晶體管的全球最大的FPGA --看來FPGA老大老二在FPGA大小方面掐上了。但實際上這是英特爾利用EMIB技術把兩個高密度Stratix 10 GX FPGA核心邏輯芯片(每顆芯片容量為510萬個邏輯單元)以及相應的I/O單元融合而成的怪物級FPGA,在架構上毫無亮點,而且如此大容量的FPGA配了一個17.4Gbps的收發器,這樣的比大小我看意義不大。

圖4  英特爾的Stratix 10 GX FPGA配置

圖4? 英特爾的Stratix 10 GX FPGA配置

這就好比20世紀初期各國海軍強國攀比自己戰列艦的口徑大小,當時日本造了全球口徑最大的戰列艦大和號,該艦裝備有3座三聯裝94式45倍徑460毫米口徑艦炮以及各種副炮和對空機關炮,全艦覆蓋大量裝甲,艦身的重要部位都能經受460毫米大炮的轟擊,其煙囪也在開口處和側面裝上了蜂窩狀鋼板和防護裝甲,堪稱攻擊和防護都巨牛的戰艦,結果,它被美國航母艦載機擊沉了!

圖5   大和號1945年在沖繩戰役中被艦載機擊沉

圖5? ?大和號1945年在沖繩戰役中被艦載機擊沉

所以,我看這樣的比大小沒有多少實際意義,因為新的計算需求和范式需要新的處理器架構需要高速的通信帶寬,僅僅提升邏輯單元沒有意義,FPGA需要綜合的強悍性能。

Versal? Premium的性能一覽

那么Versal? Premium的性能如何呢?今天,賽靈思的三位發言人給我們做了詳細的介紹。

圖6  賽靈思的三位發言人

圖6? 賽靈思的三位發言人

賽靈思產品線營銷與管理高級總監Sumit Shah介紹說來自多元化應用與工作負載的數據爆炸性增長驅動網絡轉型,賽靈思估計子核心網方面,隨著5G商用,核心網復合增長率是 313%!而在安全則需要最高等級,在計算與帶寬方面,端口速度增長超過摩爾定律。

圖7圖8   數據爆炸性增長驅動網絡轉型圖7圖8   數據爆炸性增長驅動網絡轉型

圖7圖8???數據爆炸性增長驅動網絡轉型

而賽靈思的Versal? Premium可以助力實現實現速度最快、最安全的網絡它把帶寬提升了3倍,計算密度提升了2倍,并集成了大量的硬IP。?

圖9     Versal? Premiume構成

圖9? ? ?Versal? Premiume構成

賽靈思高端 ACAP 和 FPGA 產品線高級經理Mike Thompson介紹說Versal? Premium采用的是臺積電7nm 工藝制程,作為Versal ACAP 的最新產品系列, Versal Premium 系列可提供比當前FPGA高達三倍的吞吐量,且內置以太網、Interlaken 和加密引擎以打造快速、安全的網絡。

圖10 Versal? Premiume 有112Gbps收發器

圖10?Versal? Premiume?有112Gbps收發器

據介紹,Versal? Premium有 112Gbps PAM4 收發器、數百 GbE (千兆位以太網)和 Interlaken 連接、高速加密以及內置 DMA、同時支持CCIX 和 CXL 支持的 PCIe? Gen5等,可以實現單芯片 400G 和 800G 解決方案。

圖11  Versal Premium集成的IP非常多

圖11? Versal Premium集成的IP非常多

Mike表示Versal? Premium集成的 IP (主要是各類存儲控制器、接口等)等效于22個16nm工藝 FPGA 的邏輯密度!集成如此多IP的目的是讓開發者能夠專注于差異化(相對于分散精力在設計基礎架構與連接上)。他舉例要在Virtex? UltraScale+TM VU9P開發這些資源需要20萬個LUT ,而現在,需要的數量是0!

圖12 Versal? Premiume集成 IP優勢對比

圖12?Versal? Premiume集成?IP優勢對比

在應用開發上,Mike表示Versal? Premium是面向各種開發者的軟硬件集成平臺,硬件開發者、軟件開發者以及數據科學家都可以利用這個平臺開發應用。配合 Vitis? 統一軟件平臺與 Vivado? 設計套件,Versal? Premium可為軟件與硬件開發者提供完整的解決方案堆棧,尤其是針對人工智能應用,ACAP有專門的引擎可以加速AI運算。

圖13 Versal? Premiume是面向各種開發者的軟硬件集成平臺

圖13?Versal? Premiume是面向各種開發者的軟硬件集成平臺

這是Versal? Premium和特斯拉上GPU性能對比。在圖像檢測上是GPU的2.3倍,在對象檢測上最高提高了7.7倍,自異常檢測(隨機森林算法)上是英特爾至強CPU的65倍!

圖14 Versal? Premiume性能對比

圖14?Versal? Premiume性能對比

在片上存儲器帶寬與容量方面,Versal? Premium與GPU對比最高可以提升25倍!

圖15  片上存儲器帶寬與容量對比

圖15??片上存儲器帶寬與容量對比

與ASIC、ASSP在吞吐量上對比,Versal? Premium也遠遠勝出。

圖16  Versal? Premium和ASSP的吞吐量對比

圖16??Versal? Premium和ASSP的吞吐量對比

Versal? Premium 在提升性能的同時,功耗降低一半以上,可以在低于 100 瓦功耗下提供單芯片 800G DCI (數據中心互聯)吞吐量!

圖17  Versal? Premium的功耗降低很多

圖17??Versal? Premium的功耗降低很多

Mike表示隨著 5G 網絡投入運營,網絡流量大幅增長,導致現有空間和功耗范圍內功耗優化吞吐量與計算密度的需求不斷提高。為支持業界應對這一挑戰,Versal Premium 系列提供了高達 9Tb/s 的可擴展、自適應串行帶寬。具體方法是將 112G PAM4 收發器與集成的網絡功能模塊用于核心網、城域網和數據中心互聯( DCI )基礎設施,將每端口帶寬密度提高兩倍,并降低時延高達 50%。?

圖18  Versal Premium 系列提供了高達 9Tb/s 帶寬

圖18??Versal Premium 系列提供了高達 9Tb/s 帶寬

另外,這種預制連接可實現安全的多太位以太網( multi-terabit Ethernet ),靈活支持各種數據速率與協議。通道化以太網硬核能夠以最小占板空間提供高達 5Tb/s 的吞吐量,同時高速加密引擎可提供高達 1.6Tb/s 的加密線路速率吞吐量,并支持 AES-GCM-256/128、MACsec 和 IPsec 。?

圖19  Versal Premium 系列可實現安全的多太位以太網

圖19??Versal Premium?系列可實現安全的多太位以太網

Mike表示Versal Premium 系列AI方面也有一些獨特優勢,例如在網絡異常檢測AI上,支持入侵檢測、惡意軟件識別,它有應對新興威脅的自適應 AI 算法,而賽靈思隨機森林算法(Random Forest)IP 現已供貨。在配置與網絡性能 AI上,可以自動檢測與性能瓶頸糾正,還能自動配置,最大限度延長正常運行時間 (MLP)。

圖20  Versal Premium 系列AI方面也有一些獨特優勢

圖20??Versal Premium 系列AI方面也有一些獨特優勢

供貨情況

據介紹,Versal Premium 系列旨在幫助超大規模數據中心用戶為多元化的數據中心工作負載實現最高加速水平。將超過 120TB/s 的片上存儲器帶寬與可定制存儲器層級相結合,能夠減少數據移動從而消除相應的關鍵瓶頸,與此同時,還支持以嵌入式方式將預制連接與硬核集成到現有云基礎設施中。從基因組學、數據分析和視頻轉碼,到針對語音和圖像識別的 AI 推斷。

Versal Premium 有VP1102、VP1202、VP1402、VP1502、VP1552、VP1702、VP11802 七個系列,在系統邏輯單元,IP核的配置上有所差異。

圖21  Versal Premium產品系列組合

圖21? Versal Premium產品系列組合

據悉,Versal Premium系列將于 2021 年上半年開始為早期用戶提供樣品。目前已提供文檔,客戶可立即使用 Versal Prime 評估套件開始原型設計。Versal Prime 器件與 Versal Premium 器件擁有眾多相同的架構模塊,支持引腳遷移至 Versal Premium。

圖22  Versal Premium供應情況

圖22? Versal Premium供應情況

注:本文為原創文章,轉載請注明作者及來源

相關文章

Digi-Key