為 AI 工廠供電：EPC GaN 解決方案如何為 NVIDIA MGX 架構提供強大動力

技術分享雜談GaN技術 – Maurizio Di Paolo Emilio 五月 28, 2026

數位世界的發展速度比以往任何時候都快。我們正處於一場新的 AI 工業革命之中，資料中心正在轉變為 AI 工廠，也就是高密度、專門建置的設施，用於大規模創造智慧。人工智慧不再只是一場軟體革命，它正迅速成為一場基礎設施革命。這種運算典範的轉變非常深刻：人類不再是唯一與 AI 互動的對象；相反，越來越複雜的代理式 AI 模型正在與其他 AI 代理對話，協調任務、自主推理，並處理極長的 token 序列。

AI 推理和代理式工作流程如今備受關注，正在徹底改變工作負載特性。運算正在從人類與 AI 的互動快速演進為 AI 與 AI 的協作，智慧代理不斷進行通訊、做出決策，並自主優化流程。這種演進給基礎設施帶來了前所未有的壓力，尤其是對於基於混合專家（MoE）架構的先進推理模型而言，token 會在 GPU、機架甚至分散式資料中心之間動態路由，對延遲極為敏感。

最終結果是出現了前所未有的運算需求。四大關鍵擴展定律——預訓練、後訓練、測試時擴展和代理式擴展——正在重塑下一代運算基礎設施的設計。挑戰不再只是原始運算性能，而是在滿足延遲、熱管理和能源效率等嚴格限制的同時，實現可擴展性能。

為了了解 AI 工廠在實務中如何建置，NVIDIA MGX™ 為可擴展且靈活的加速運算基礎設施提供了模組化基礎。MGX 解決了基礎設施模組化和更快部署的問題，但另一個更嚴峻的瓶頸正在形成：電源傳輸。隨著 AI 系統變得更複雜、更高密度，電源轉換效率對於維持性能和效率至關重要。在這裡，關鍵推動力是宜普電源轉換公司（EPC）的氮化鎵（eGaN^®）技術，它提供了為下一代 AI 基礎設施供電所需的高效率、高功率密度和熱性能。

NVIDIA MGX：面向加速運算的模組化基礎設施

NVIDIA MGX 無需針對每一代新加速器進行完整硬體重新設計，而是提供開放式模組化參考架構，涵蓋單節點伺服器、機架級系統、Pod 級部署以及完整的 AI 資料中心基礎設施。

OEM 和 ODM 無需為每個特定使用案例建置新平台，而是可以利用標準化架構框架，支援 CPU、GPU、網路和資料處理單元（DPU）的多種不同組合。

這種模組化方法顯著降低了非經常性工程（NRE）成本，並將上市時間縮短數月。通用硬體「DNA」使合作夥伴能夠在多代加速運算平台中重複利用設計元素，提高投資回報率，並實現快速系統客製化。MGX 針對基於 x86 和 Arm 的伺服器架構以及 PCIe 等產業標準進行了優化，以實現廣泛相容性。

MGX 的突出之處在於其靈活性。據 NVIDIA 稱，該架構支援 100 多種標準系統配置，使可擴展設計能夠從企業伺服器擴展到大規模 AI 基礎設施，而無需完整重新設計。然而，隨著 AI 運算密度持續提升，僅有模組化已不再足夠。挑戰越來越轉向如何高效供電，以支援快速成長的熱需求和運算需求。

面向代理式 AI 的第三代 MGX 機架架構

在機架層面，與 Vera Rubin 平台同步推出的第三代 NVIDIA MGX 架構專為滿足代理式 AI 系統快速出現的需求而設計。這類工作負載需要高吞吐量推理、低延遲互連、密集 CPU 沙箱，以及用於鍵值快取擴展和持續推理工作流程的大容量記憶體。

第三代 MGX 機架在機械設計、配電和熱管理方面整合了多項工程創新。完全模組化的印刷電路板（PCB）式機架取消了傳統線纜、軟管和系統風扇，從而實現無纜、無風扇的運算環境。NVLink 交換托盤可以在不中斷機架功能的情況下更換，從而提高大規模部署中的彈性和可維護性。

另一個關鍵創新是功率優化。動態功率調度可使系統根據任意時刻的工作負載需求，在 CPU、GPU 和 NVLink 子系統之間智慧分配可用功率，而機架級電容器有助於抑制 AI 推理和訓練工作負載中常見的突發功率尖峰。該系統還採用 100% 液冷，可在高達 45 攝氏度的溫水入口溫度下運行，從而降低電源使用效率（PUE），並將更多能源用於運算，而不是冷卻開銷。

向 800 V_DC 電源架構的策略轉變

NVIDIA AI 基礎設施策略的一個關鍵要素是採用 800 V_DC 電源架構。隨著機架功率密度提高，下一代加速運算需求正在挑戰傳統交流供電系統的經濟可行性。NVIDIA 的 800 V_DC 方案減少了電源轉換級數，並將直流配電推進到更靠近機架的位置，以提高效率並簡化資料中心基礎設施。

重要的是，該架構既可面向未來擴展，又向後相容。新的 AI 工廠可以採用端到端 800 V_DC 配電以實現最高能源效率，而現有設施則可以部署帶有 MGX 相容電源機架的混合架構，同時不犧牲在土地、電力基礎設施或建築外殼方面的既有投資。該架構還支援分散式電池備份系統，從而提高韌性並支援更高密度的運算部署。

隨著 GPU 功率需求從 Blackwell 架構的 1,000 W 級別擴展到未來 Feynman 級 GPU 預計的 6,000 W，傳統 48 V_DC 配電正達到其物理極限。以 48 V 向單個 Vera Rubin 伺服器板輸送 12 kW 功率需要 250 A 電流，這對於標準連接器來說並不現實，並會產生巨大的銅損。

NVIDIA 800 V_DC 電源架構透過將典型伺服器板的電流降低到約 15 A 來解決這一「功率牆」，使相同銅橫截面積可傳輸的功率增加 157%。這種轉變使 GPU 附近最關鍵區域的元件面積減少 26%。為了實現這種高壓配電，目前已出現三種主要架構方案，每種方案都利用了宜普電源轉換公司（EPC）的 GaN 技術：

800 V_DC 至 48 V_DC：該方法使用緊湊型 800 V 至 48 V 轉換器，通常位於配電板（PDB）上或伺服器本地。它允許伺服器板繼續使用傳統 48 V 硬體，從而簡化向更高功率水平的過渡。
800 V_DC 至 12 V_DC：透過在伺服器板上將 800 V 直接轉換為 12 V，與較低電壓匯流排相比，配電損耗可降低四倍。該架構通常採用 8 級 ISOP 配置，使用 100 V 或 150 V GaN 裝置，在「NVLink 半徑」內實現高密度。
800 V_DC 至 6 V_DC：這代表了一種面向處理器所需低於 1 V 電壓的高效率單級轉換路徑。雖然它會增加板上配電損耗，但可最大限度減少轉換級數。該配置受益於 EPC 最新低壓 GaN 電晶體，這些裝置專為大電流負載點（POL）轉換而設計。

800 V_DC 至 48 V_DC

下一代 AI 電源傳輸中最務實的方法之一，是透過緊湊型隔離式轉換器將 800 V_DC 降壓至 48 V_DC，該轉換器通常位於配電板（PDB）上或伺服器機架本地。該架構支援現有 48 V 伺服器生態系統，使超大規模資料中心營運商和 OEM 能夠利用成熟基礎設施，同時擴展到大幅更高的機架功率密度。

從系統角度來看，48 V 中間匯流排在效率、電流處理能力和架構靈活性之間取得了有效平衡。這使設計人員能夠利用現有伺服器板拓撲和熟悉的 48 V 配電層，同時盡量減少對現有硬體生態系統的干擾。

但在半導體層面，該級需要具備高開關頻率和高功率密度的裝置，同時不能產生過高熱損耗。這正是 150V GaN FET（例如 EPC2376）能夠在 ISOP 的初級和次級側提供基準解決方案的原因。與矽 MOSFET 替代方案相比，這些裝置可顯著降低開關損耗，幾乎沒有反向恢復電荷，並具有更高功率密度，從而實現更小的磁性元件、更高工作頻率和更緊湊的轉換器實現。

800 V_DC 至 12 V_DC

另一種更積極的架構方法是在伺服器板上將 800 V_DC 直接轉換為 12 V_DC，從而顯著減少中間轉換步驟數量並提高整體系統效率。最直接的優勢體現在配電方面：在更高電壓下運行可大幅降低電流，因此導通損耗約為較低電壓匯流排架構的四分之一。

這種拓撲對 AI 加速器尤其具有吸引力，因為其電源傳輸必須在嚴格的物理限制下完成，尤其是在所謂「NVLink 半徑」內，靠近 GPU 對於最大限度減少寄生損耗並保持瞬態性能至關重要。

為了實現所需的功率密度和熱性能，EPC 推薦採用八級輸入串聯輸出並聯（ISOP）架構。該配置可分擔多級電壓應力，使初級側能夠使用 150 V GaN 裝置，次級側使用 40 V 裝置，例如 EPC2366，這些裝置相比更高電壓裝置天生具有更佳開關特性和更低導通損耗。除了優化半導體效率外，ISOP 方法還可簡化變壓器實現，改善相位交錯，減少輸出電容，並在系統中更均勻地分布熱耗散——這些都是日益受功率約束的 AI 伺服器環境中的關鍵優勢。

800 V_DC 至 6 V_DC

在性能導向最強的一端，從 800 V_DC 直接轉換到 6 V_DC 代表了一種為現代 AI 處理器供電的超高效率路徑，而這些處理器最終需要低於 1 V 的供電軌。透過在單個隔離級中更接近最終工作電壓，該架構可最大限度降低轉換複雜性並減少中間電源級數量，從而可能提高端到端效率。

然而，其取捨在於板上配電。較低匯流排電壓會提高電流水平，導致 PCB 走線和互連上的導通損耗增加。因此，該架構需要極高效率的本地電源轉換才能保持可行性。

這正是下一代低壓 GaN 電晶體變得至關重要的地方。EPC 最新的 25 V 和 15 V GaN FET，即 EPC2379 和 EPC 2378，分別針對大電流負載點（POL）轉換進行了優化，可提供超低導通電阻、零反向恢復電荷，以及頻率擴展至 MHz 範圍的卓越開關性能。這些特性使緊湊型大電流 POL 穩壓器能夠在保持高功率密度和快速瞬態響應的同時，高效提供 GPU 和 AI 加速器所需的超低電壓。

EPC GaN：ISOP 轉換器的技術骨幹

隔離級必須非常高效且輕薄，以彌合 800 V_DC 配電與運算級電壓之間的差距。而明顯勝出的方案是輸入串聯輸出並聯（ISOP）拓撲。透過將多個模組化 LLC 諧振轉換器的輸入串聯堆疊，800 V 應力由多個級分擔，使系統能夠使用低壓 GaN FET，而不是高壓碳化矽（SiC）或老舊矽 MOSFET。

為什麼採用 GaN 的 8 級 ISOP 是基準選擇：在 ISOP 配置中使用八個模組，相比傳統單級設計具有多項技術優勢：

卓越的半導體性能：低壓 GaN FET 具有更優的品質因數（FoM）。例如，EPC2381（第 7 代）100 V 裝置的 R_DS(on) 僅為 0.8 mΩ，而類似封裝中最佳矽替代裝置為 6.5 mΩ。
熱分布和電氣分布：將轉換分散到八個級，有助於在 PCB 上實現更好的熱分布，並簡化變壓器設計。
透過交錯降低紋波：多個模組以交錯相位運行，可顯著降低輸出電流紋波，同時提高紋波頻率，從而減少對大型笨重輸出電容器的需求。
極高密度：EPC 的表面貼裝 GaN 裝置可實現極薄的轉換器，通常僅 8 mm，使其相容 Rubin 級系統所需的先進液冷冷板。

這一方案的實際實現是 EPC91123，這是一款基於 ISOP 的 6 kW DC-DC 轉換器，可將 800 V_DC 轉換為 12.5 V_DC。該設計峰值效率達到 98.3%，滿載效率達到 97%，同時占用的電路板面積小於 5,000 mm²。實驗室測試確認，該架構可在自然電壓平衡下處理高達 500 A 的輸入和輸出電流，無需複雜控制迴路（圖 1 和圖 2）。

圖 1：EPC91123 評估板

圖 2：ISOP 轉換器方塊圖

重新構想中間匯流排轉換

EPC 針對將 48 V 電源軌轉換為 12 V 或 6 V 輸出的中間匯流排級轉換器，對競爭方案進行了評估，重點關注 LLC 諧振轉換器和混合開關電容（HSC）拓撲。

EPC 更傾向於用於 48 V 至 12 V 轉換的 Type I LLC 架構，因為與 HSC 架構相比，它具有變壓器更簡單、繞組匝數更少的優勢。該論點基於實際磁性元件實現：Type I LLC 拓撲需要更少的初級繞組和更少的變比，因此複雜性更低，同時還能保持效率。對於功率密度不斷提高的 AI 系統而言，這類簡化非常重要，因為磁性損耗和變壓器尺寸正日益成為瓶頸。

與此同時，低壓轉換級也正轉向 25V 和 15V GaN 裝置，以提高下游 POL 轉換器的效率和密度。

負載點轉換：最後的效率之戰

電源傳輸的最後一級——為 GPU 和 AI 加速器供電的 POL 穩壓器——可以說是 GaN 展現最大優勢的環節。

EPC 展示了 EPC2371，這是一款針對大電流 POL 應用優化的 25 V GaN 電晶體。該裝置具有：

0.65 mΩ 典型 R_DS(on)
88 A 連續電流能力
412 A 脈衝電流處理能力
17 nC 閘極電荷
0 nC 反向恢復電荷
緊湊的 2.6 mm × 3.3 mm 占位面積。

在 700 kHz 開關頻率和 0.8 V 輸出條件下的效率測試表明，在有意義的負載範圍內，即使在受控氣流條件下不使用散熱器，轉換效率也可超過 90%。這些結果顯示，即使在現代 AI 負載所需的激進開關頻率下，GaN 也能夠保持高效率。

對於超低電壓應用，EPC 的 15 V GaN FET EPC2370 進一步提升性能，具有 0.28 mΩ 的極低電阻，同時仍支援高電流密度。即使在高於 2 MHz 的開關頻率下，其效率仍達到基準水平，這支援了 GaN 能夠同時實現更高開關頻率和更小無源元件占位面積的觀點。

這為 AI 伺服器設計人員提供了顯著減少 PCB 面積、改善瞬態響應並降低冷卻開銷的機會（圖 3）。

圖 3：EPC GaN 在每一電壓等級均成為基準

結論

隨著 AI 工廠持續擴展，EPC 已經在展望採用第 8 代技術的未來。這些將於 2027 年底推出的下一代裝置，將支援 3 -5 MHz 高密度負載點（POL）解決方案，進一步縮小高壓配電與 GPU 之間的差距。透過將 NVIDIA MGX 的模組化靈活性與 EPC GaN 解決方案無可匹敵的功率密度相結合，產業終於能夠交付下一代 AI 所需的高能效、兆瓦級機架

參考資料

GaN Power Devices for Efficient Power Conversion，第四版 - 作者： Alex Lidow、 Michael de Rooij、 John Glaser、Alejandro Pozo Arribas、Shengke Zhang、Marco Palma、David Reusch、Johan Strydom。

M. Di Paolo Emilio，The Architectural Imperative of 800 VDC in Next-Generation AI Factories - Data Centre Digest

M. Di Paolo Emilio，Powering the AI Factory: The Role of 800 VDC Distribution and ISOP Converters in Next-Generation Data Centers – Data Centre Digest

Huntington, J.; Tu, M.，「800 VDC Architecture for Next-Generation AI Infrastructure，」
NVIDIA 白皮書，2025。

Tags: Data Centers