近年來,摩爾定律“失速”使得中央處理器(CPU)性能增長的邊際成本急劇上升。有研究數據顯示,CPU性能年增長率(面積歸壹化後)只有3%左右。然而,人們對計算的需求仍然呈爆炸式增長。
在此背景下,包括人工智能(AI)芯片在內的專用計算芯片紛紛走上歷史舞臺。目前,以數據為中心的專用處理器“DPU”正在成為專用計算芯片的“新貴”。美國芯片巨頭NVIDIA甚至將其定位為數據中心繼CPU、GPU之後的“第三主芯片”,掀起行業熱潮。
有了CPU和GPU,DPU真的有這麽大的潛力嗎?它的應用場景有哪些?中國能否抓住DPU的發展機遇?近日,由中國科學院計算技術研究所(以下簡稱中科院計算所)主編,中科宇數(京)科技有限公司、中國計算機聯合會集成電路設計專業組、計算機體系結構國家重點實驗室共同撰寫的業界首部DPU技術白皮書(以下簡稱DPU技術白皮書)發布。結合以上問題,中國科學報聯系采訪了主要編輯,壹探究竟。
“DPU最直接的作用就是作為CPU的卸載引擎,它的作用就是給CPU‘減負’。”《DPU科技白皮書》主編、中科院計算所研究員閆桂海告訴《中國科學報》,DPU為數據中心提供了壹個“殺雞”工具,節省了CPU,從而釋放CPU的計算能力,留給更需要它的業務負載。
接管CPU的網絡協議處理任務就是壹個很好的例子。閆桂海說,比如壹個數據中心,僅處理壹個線速10G的網絡,就需要8核高端CPU壹半左右的計算能力,而如果是40G、100G甚至更高速度的網絡,性能開銷就更高。
雲計算巨頭亞馬遜雲服務(AWS)形象地稱之為“數據中心稅”——訪問網絡數據會在運行業務程序之前占用大量計算資源。
“DPU誕生的使命是承載網絡虛擬化、硬件資源池等基礎設施服務,將CPU的計算能力釋放給上層應用。”《DPU技術白皮書》編委會成員、中科玉樹高級副總裁張宇解釋說,將“CPU效率低,GPU處理不了”的負荷卸給專用DPU,可以抵消“數據中心稅”,有助於提高整個計算系統的效率,降低整個系統的總擁有成本。
張宇說,DPU主要處理網絡數據和輸入輸出(IO)數據,提供帶寬壓縮、安全加密、網絡功能虛擬化等功能。“這些可以說是距離普通用戶日常感知的各種應用最遠的功能。這些基礎功能是實現更高效、更安全、更實時的日常應用的保障。”
在DPU有三種關於“D”的說法,所以DPU有三個中文名字。
壹個是“數據”,DPU稱為“數據處理器”;壹個是“數據中心”,DPU翻譯為“數據中心處理器”;壹種是“以數據為中心”,相應的,DPU可以稱為“以數據為中心的處理器”。
“以上關於DPU的三種說法,從不同角度反映了DPU的特點,都有壹定的可取之處。我們認為可以把DPU的內涵理解為三個不同的維度。”李曉偉說。
“隨著‘軟件硬件’成為常態,異構計算的潛力將因各種dpu的普及而得到充分發揮。”《DPU科技白皮書》編委會成員、中科禦樹聯合創始人兼CTO陸認為,新壹代不僅可以作為計算的加速引擎,還具備“控制平面”功能(即追求數據處理功能的覆蓋),可以更高效地完成網絡虛擬化、IO虛擬化、存儲虛擬化等任務,將CPU的計算能力完全釋放給應用。
“可以說,DPU的出現,會讓各行各業業務層的數字化應用更全面、更流暢、更綠色。”魯對說:
從市場規模來看,根據Fungible和NVIDIA的預測,數據中心使用的DPU將達到與數據中心服務器相同的水平。
“服務器每年增加大約1000萬個數量級。壹臺服務器可以沒有GPU,但壹定要有壹個或多個dpu,就像每臺服務器都要配網卡壹樣。”閆桂海表示,每年新增約15萬臺服務器,每臺DPU按10000元計算,將是上千億的市場規模。
在這個數十億美元的市場中,國際傳統芯片巨頭如NVIDIA、Intel、Marwell、Broadcom等廠商都在積極布局DPU產品研發。
這些芯片巨頭的布局並不意外。他們可能有智能網卡的研發基礎(如博通)來繼續延伸自己的技術觸角,或者通過收購專門的加速芯片公司(如英偉達、英特爾)來補充自己在DPU領域的技術能力。與他們相比,值得壹提的是亞馬遜旗下的兩大雲計算巨頭AWS和阿裏雲早已註意到了數據中心費用的問題,並做出了很好的實踐。
據《DPU技術白皮書》介紹,2013年,AWS開發了Nitro產品,將為虛擬機提供遠程資源、加解密、故障跟蹤、安全策略等服務的資源開銷全部放在專用加速器上,“輕量級管理程序+定制硬件”的出現壹舉節省了30%的CPU資源。幾乎與此同時,阿裏雲也開始研發“龍架構”(X-Dragon System),用硬件MOC卡支持網絡、IO、存儲、外設的虛擬化。現在,“龍架構”已經換到第四代了。
“可以看出,DPU其實已經在業內孕育了很長時間。從早期的網絡協議處理卸載到後續的網絡、存儲、虛擬化卸載,其作用非常顯著,但在此之前,DPU是‘名存實亡’,現在是時候邁出新的壹步了。”閆桂海說。
幸運的是,壹些圍繞DPU科技的國內創業公司逐漸湧現。除了參與編寫《DPU技術白皮書》的中科玉樹,還有鮑雲智能、星雲智聯、芯啟元、雲脈新聯等新成立的科技創業公司,呈現出良好的勢頭。
以中科玉樹為例。這個創始團隊來自中科院計算所的壹家初創企業,對DPU的理論基礎和數據中心的架構有著深刻的理解。由於亞馬遜、賽靈思、華為的部分核心骨幹的參與,項目實現經驗也得到了很好的積累。2019年,中科玉樹完成第壹代DPU芯片,預計2022年推出第二代DPU芯片“K2”。
“我們認為DPU的潛力非常巨大。”在閆桂海看來,從技術發展的角度來看,DPU的出現是必然的——過去五年上層應用對計算能力的需求急劇增加,使得DPU有很多應用場景,它將廣泛分布在5G、雲計算、大數據、數據中心、邊緣計算等領域。
從今年工信部發布的《新型數據中心發展三年行動計劃(2021-2023)》中,桂桂海看到了新型計算芯片難得的歷史發展機遇。
規劃明確提出了“加快提升計算效率”、“推動CPU、GPU等異構計算能力提升,逐步提高自主研發計算能力部署比例”、“加強專用服務器等核心技術研發”、“基於5G、工業互聯網等關鍵應用場景建立邊緣數據中心應用基準”等要求和措施。
“雖然國內廠商在芯片產品化過程中與國外壹線廠商仍有差距,但在對DPU架構的理解上有獨到見解,而中國目前在數據中心領域無論是市場規模、增長率還是用戶數量都有很大優勢。”閆桂海認為,國內廠商有望充分利用這種“應用勢能”,加快發展步伐,在DPU賽道與國外廠商壹較高下。
然而,挑戰和機遇並存。
"目前,要解決DPU的標準化應用還存在壹些挑戰."閆桂海解釋說,由於數據中心本身的復雜性,壹方面各大廠商使用商用現成組件(COTS)搭建系統,追求低成本,另壹方面也嘗試分層次提供服務,為不同類型的客戶打造標準化產品,但其他所有技術實現幾乎都是“八仙過海,各顯神通”——比如AWS有Nitro,阿裏雲有MOC。