部落格:氮化鎵技術如何擊敗矽技術

雜談GaN技術

Search in 全部 Title Contents
為 AI 工廠供電:EPC GaN 解決方案如何為 NVIDIA MGX 架構提供強大動力

為 AI 工廠供電:EPC GaN 解決方案如何為 NVIDIA MGX 架構提供強大動力

五月 28, 2026

數位世界的發展速度比以往任何時候都快。我們正處於一場新的 AI 工業革命之中,資料中心正在轉變為 AI 工廠,也就是高密度、專門建置的設施,用於大規模創造智慧。人工智慧不再只是一場軟體革命,它正迅速成為一場基礎設施革命。這種運算典範的轉變非常深刻:人類不再是唯一與 AI 互動的對象;相反,越來越複雜的代理式 AI 模型正在與其他 AI 代理對話,協調任務、自主推理,並處理極長的 token 序列。

AI 推理和代理式工作流程如今備受關注,正在徹底改變工作負載特性。運算正在從人類與 AI 的互動快速演進為 AI 與 AI 的協作,智慧代理不斷進行通訊、做出決策,並自主優化流程。這種演進給基礎設施帶來了前所未有的壓力,尤其是對於基於混合專家(MoE)架構的先進推理模型而言,token 會在 GPU、機架甚至分散式資料中心之間動態路由,對延遲極為敏感。

最終結果是出現了前所未有的運算需求。四大關鍵擴展定律——預訓練、後訓練、測試時擴展和代理式擴展——正在重塑下一代運算基礎設施的設計。挑戰不再只是原始運算性能,而是在滿足延遲、熱管理和能源效率等嚴格限制的同時,實現可擴展性能。

為了了解 AI 工廠在實務中如何建置,NVIDIA MGX™ 為可擴展且靈活的加速運算基礎設施提供了模組化基礎。MGX 解決了基礎設施模組化和更快部署的問題,但另一個更嚴峻的瓶頸正在形成:電源傳輸。隨著 AI 系統變得更複雜、更高密度,電源轉換效率對於維持性能和效率至關重要。在這裡,關鍵推動力是宜普電源轉換公司(EPC)的氮化鎵(eGaN®)技術,它提供了為下一代 AI 基礎設施供電所需的高效率、高功率密度和熱性能。

 NVIDIA MGX:面向加速運算的模組化基礎設施

NVIDIA MGX 無需針對每一代新加速器進行完整硬體重新設計,而是提供開放式模組化參考架構,涵蓋單節點伺服器、機架級系統、Pod 級部署以及完整的 AI 資料中心基礎設施。

OEM 和 ODM 無需為每個特定使用案例建置新平台,而是可以利用標準化架構框架,支援 CPU、GPU、網路和資料處理單元(DPU)的多種不同組合。

這種模組化方法顯著降低了非經常性工程(NRE)成本,並將上市時間縮短數月。通用硬體「DNA」使合作夥伴能夠在多代加速運算平台中重複利用設計元素,提高投資回報率,並實現快速系統客製化。MGX 針對基於 x86 和 Arm 的伺服器架構以及 PCIe 等產業標準進行了優化,以實現廣泛相容性。

MGX 的突出之處在於其靈活性。據 NVIDIA 稱,該架構支援 100 多種標準系統配置,使可擴展設計能夠從企業伺服器擴展到大規模 AI 基礎設施,而無需完整重新設計。然而,隨著 AI 運算密度持續提升,僅有模組化已不再足夠。挑戰越來越轉向如何高效供電,以支援快速成長的熱需求和運算需求。

面向代理式 AI 的第三代 MGX 機架架構

在機架層面,與 Vera Rubin 平台同步推出的第三代 NVIDIA MGX 架構專為滿足代理式 AI 系統快速出現的需求而設計。這類工作負載需要高吞吐量推理、低延遲互連、密集 CPU 沙箱,以及用於鍵值快取擴展和持續推理工作流程的大容量記憶體。

第三代 MGX 機架在機械設計、配電和熱管理方面整合了多項工程創新。完全模組化的印刷電路板(PCB)式機架取消了傳統線纜、軟管和系統風扇,從而實現無纜、無風扇的運算環境。NVLink 交換托盤可以在不中斷機架功能的情況下更換,從而提高大規模部署中的彈性和可維護性。

另一個關鍵創新是功率優化。動態功率調度可使系統根據任意時刻的工作負載需求,在 CPU、GPU 和 NVLink 子系統之間智慧分配可用功率,而機架級電容器有助於抑制 AI 推理和訓練工作負載中常見的突發功率尖峰。該系統還採用 100% 液冷,可在高達 45 攝氏度的溫水入口溫度下運行,從而降低電源使用效率(PUE),並將更多能源用於運算,而不是冷卻開銷。

向 800 VDC 電源架構的策略轉變

NVIDIA AI 基礎設施策略的一個關鍵要素是採用 800 VDC 電源架構。隨著機架功率密度提高,下一代加速運算需求正在挑戰傳統交流供電系統的經濟可行性。NVIDIA 的 800 VDC 方案減少了電源轉換級數,並將直流配電推進到更靠近機架的位置,以提高效率並簡化資料中心基礎設施。

重要的是,該架構既可面向未來擴展,又向後相容。新的 AI 工廠可以採用端到端 800 VDC 配電以實現最高能源效率,而現有設施則可以部署帶有 MGX 相容電源機架的混合架構,同時不犧牲在土地、電力基礎設施或建築外殼方面的既有投資。該架構還支援分散式電池備份系統,從而提高韌性並支援更高密度的運算部署。

隨著 GPU 功率需求從 Blackwell 架構的 1,000 W 級別擴展到未來 Feynman 級 GPU 預計的 6,000 W,傳統 48 VDC 配電正達到其物理極限。以 48 V 向單個 Vera Rubin 伺服器板輸送 12 kW 功率需要 250 A 電流,這對於標準連接器來說並不現實,並會產生巨大的銅損。

NVIDIA 800 VDC 電源架構透過將典型伺服器板的電流降低到約 15 A 來解決這一「功率牆」,使相同銅橫截面積可傳輸的功率增加 157%。這種轉變使 GPU 附近最關鍵區域的元件面積減少 26%。為了實現這種高壓配電,目前已出現三種主要架構方案,每種方案都利用了宜普電源轉換公司(EPC)的 GaN 技術:

  • 800 VDC 至 48 VDC該方法使用緊湊型 800 V 至 48 V 轉換器,通常位於配電板(PDB)上或伺服器本地。它允許伺服器板繼續使用傳統 48 V 硬體,從而簡化向更高功率水平的過渡。  
  • 800 VDC 至 12 VDC透過在伺服器板上將 800 V 直接轉換為 12 V,與較低電壓匯流排相比,配電損耗可降低四倍。該架構通常採用 8 級 ISOP 配置,使用 100 V 或 150 V GaN 裝置,在「NVLink 半徑」內實現高密度。
  • 800 VDC 至 6 VDC這代表了一種面向處理器所需低於 1 V 電壓的高效率單級轉換路徑。雖然它會增加板上配電損耗,但可最大限度減少轉換級數。該配置受益於 EPC 最新低壓 GaN 電晶體,這些裝置專為大電流負載點(POL)轉換而設計。

800 VDC 至 48 VDC

下一代 AI 電源傳輸中最務實的方法之一,是透過緊湊型隔離式轉換器將 800 VDC 降壓至 48 VDC,該轉換器通常位於配電板(PDB)上或伺服器機架本地。該架構支援現有 48 V 伺服器生態系統,使超大規模資料中心營運商和 OEM 能夠利用成熟基礎設施,同時擴展到大幅更高的機架功率密度。

從系統角度來看,48 V 中間匯流排在效率、電流處理能力和架構靈活性之間取得了有效平衡。這使設計人員能夠利用現有伺服器板拓撲和熟悉的 48 V 配電層,同時盡量減少對現有硬體生態系統的干擾。

但在半導體層面,該級需要具備高開關頻率和高功率密度的裝置,同時不能產生過高熱損耗。這正是 150V GaN FET(例如 EPC2376)能夠在 ISOP 的初級和次級側提供基準解決方案的原因。與矽 MOSFET 替代方案相比,這些裝置可顯著降低開關損耗,幾乎沒有反向恢復電荷,並具有更高功率密度,從而實現更小的磁性元件、更高工作頻率和更緊湊的轉換器實現。

800 VDC 至 12 VDC

另一種更積極的架構方法是在伺服器板上將 800 VDC 直接轉換為 12 VDC,從而顯著減少中間轉換步驟數量並提高整體系統效率。最直接的優勢體現在配電方面:在更高電壓下運行可大幅降低電流,因此導通損耗約為較低電壓匯流排架構的四分之一。

這種拓撲對 AI 加速器尤其具有吸引力,因為其電源傳輸必須在嚴格的物理限制下完成,尤其是在所謂「NVLink 半徑」內,靠近 GPU 對於最大限度減少寄生損耗並保持瞬態性能至關重要。

為了實現所需的功率密度和熱性能,EPC 推薦採用八級輸入串聯輸出並聯(ISOP)架構。該配置可分擔多級電壓應力,使初級側能夠使用 150 V GaN 裝置,次級側使用 40 V 裝置,例如 EPC2366,這些裝置相比更高電壓裝置天生具有更佳開關特性和更低導通損耗。除了優化半導體效率外,ISOP 方法還可簡化變壓器實現,改善相位交錯,減少輸出電容,並在系統中更均勻地分布熱耗散——這些都是日益受功率約束的 AI 伺服器環境中的關鍵優勢。

800 VDC 至 6 VDC

在性能導向最強的一端,從 800 VDC 直接轉換到 6 VDC 代表了一種為現代 AI 處理器供電的超高效率路徑,而這些處理器最終需要低於 1 V 的供電軌。透過在單個隔離級中更接近最終工作電壓,該架構可最大限度降低轉換複雜性並減少中間電源級數量,從而可能提高端到端效率。

然而,其取捨在於板上配電。較低匯流排電壓會提高電流水平,導致 PCB 走線和互連上的導通損耗增加。因此,該架構需要極高效率的本地電源轉換才能保持可行性。

這正是下一代低壓 GaN 電晶體變得至關重要的地方。EPC 最新的 25 V 和 15 V GaN FET,即 EPC2379 和 EPC 2378,分別針對大電流負載點(POL)轉換進行了優化,可提供超低導通電阻、零反向恢復電荷,以及頻率擴展至 MHz 範圍的卓越開關性能。這些特性使緊湊型大電流 POL 穩壓器能夠在保持高功率密度和快速瞬態響應的同時,高效提供 GPU 和 AI 加速器所需的超低電壓。

EPC GaN:ISOP 轉換器的技術骨幹

隔離級必須非常高效且輕薄,以彌合 800 VDC 配電與運算級電壓之間的差距。而明顯勝出的方案是輸入串聯輸出並聯(ISOP)拓撲。透過將多個模組化 LLC 諧振轉換器的輸入串聯堆疊,800 V 應力由多個級分擔,使系統能夠使用低壓 GaN FET,而不是高壓碳化矽(SiC)或老舊矽 MOSFET。

為什麼採用 GaN 的 8 級 ISOP 是基準選擇:在 ISOP 配置中使用八個模組,相比傳統單級設計具有多項技術優勢:

  • 卓越的半導體性能:低壓 GaN FET 具有更優的品質因數(FoM)。例如,EPC2381(第 7 代)100 V 裝置的 RDS(on) 僅為 0.8 mΩ,而類似封裝中最佳矽替代裝置為 6.5 mΩ。
  • 熱分布和電氣分布:將轉換分散到八個級,有助於在 PCB 上實現更好的熱分布,並簡化變壓器設計。
  • 透過交錯降低紋波:多個模組以交錯相位運行,可顯著降低輸出電流紋波,同時提高紋波頻率,從而減少對大型笨重輸出電容器的需求。
  • 極高密度:EPC 的表面貼裝 GaN 裝置可實現極薄的轉換器,通常僅 8 mm,使其相容 Rubin 級系統所需的先進液冷冷板。

這一方案的實際實現是 EPC91123,這是一款基於 ISOP 的 6 kW DC-DC 轉換器,可將 800 VDC 轉換為 12.5 VDC。該設計峰值效率達到 98.3%,滿載效率達到 97%,同時占用的電路板面積小於 5,000 mm2。實驗室測試確認,該架構可在自然電壓平衡下處理高達 500 A 的輸入和輸出電流,無需複雜控制迴路(圖 1 和圖 2)。

圖 1:EPC91123 評估板

 

圖 2:ISOP 轉換器方塊圖

重新構想中間匯流排轉換

EPC 針對將 48 V 電源軌轉換為 12 V 或 6 V 輸出的中間匯流排級轉換器,對競爭方案進行了評估,重點關注 LLC 諧振轉換器和混合開關電容(HSC)拓撲。

EPC 更傾向於用於 48 V 至 12 V 轉換的 Type I LLC 架構,因為與 HSC 架構相比,它具有變壓器更簡單、繞組匝數更少的優勢。該論點基於實際磁性元件實現:Type I LLC 拓撲需要更少的初級繞組和更少的變比,因此複雜性更低,同時還能保持效率。對於功率密度不斷提高的 AI 系統而言,這類簡化非常重要,因為磁性損耗和變壓器尺寸正日益成為瓶頸。

與此同時,低壓轉換級也正轉向 25V 和 15V GaN 裝置,以提高下游 POL 轉換器的效率和密度。

負載點轉換:最後的效率之戰

電源傳輸的最後一級——為 GPU 和 AI 加速器供電的 POL 穩壓器——可以說是 GaN 展現最大優勢的環節。

EPC 展示了 EPC2371,這是一款針對大電流 POL 應用優化的 25 V GaN 電晶體。該裝置具有:

  • 0.65 mΩ 典型 RDS(on)
  • 88 A 連續電流能力
  • 412 A 脈衝電流處理能力
  • 17 nC 閘極電荷
  • 0 nC 反向恢復電荷
  • 緊湊的 2.6 mm × 3.3 mm 占位面積。

在 700 kHz 開關頻率和 0.8 V 輸出條件下的效率測試表明,在有意義的負載範圍內,即使在受控氣流條件下不使用散熱器,轉換效率也可超過 90%。這些結果顯示,即使在現代 AI 負載所需的激進開關頻率下,GaN 也能夠保持高效率。

對於超低電壓應用,EPC 的 15 V GaN FET EPC2370 進一步提升性能,具有 0.28 mΩ 的極低電阻,同時仍支援高電流密度。即使在高於 2 MHz 的開關頻率下,其效率仍達到基準水平,這支援了 GaN 能夠同時實現更高開關頻率和更小無源元件占位面積的觀點。

這為 AI 伺服器設計人員提供了顯著減少 PCB 面積、改善瞬態響應並降低冷卻開銷的機會(圖 3)。

圖 3:EPC GaN 在每一電壓等級均成為基準

結論

隨著 AI 工廠持續擴展,EPC 已經在展望採用第 8 代技術的未來。這些將於 2027 年底推出的下一代裝置,將支援 3 -5 MHz 高密度負載點(POL)解決方案,進一步縮小高壓配電與 GPU 之間的差距。透過將 NVIDIA MGX 的模組化靈活性與 EPC GaN 解決方案無可匹敵的功率密度相結合,產業終於能夠交付下一代 AI 所需的高能效、兆瓦級機架

參考資料

GaN Power Devices for Efficient Power Conversion,第四版 - 作者: Alex Lidow、 Michael de Rooij、 John Glaser、Alejandro Pozo Arribas、Shengke Zhang、Marco Palma、David Reusch、Johan Strydom。

M. Di Paolo Emilio,The Architectural Imperative of 800 VDC in Next-Generation AI Factories - Data Centre Digest

M. Di Paolo Emilio,Powering the AI Factory: The Role of 800 VDC Distribution and ISOP Converters in Next-Generation Data Centers – Data Centre Digest

Huntington, J.; Tu, M.,「800 VDC Architecture for Next-Generation AI Infrastructure,」
NVIDIA 白皮書,2025。

Tags: Data Centers

GaN 社群

GaN葡萄酒休閒酒廊

GaN Talk 播客

向氮化鎵專家提問

Ask a GaN Expert a Question

對設計實例有疑問嗎?
向氮化鎵專家提問

GaN Talk支持論壇

GaN 產品

How2 應用指南