Skip to content

Go Read Original Version in English here

中國在 AI 競爭中的唯一真正優勢?

China's True and ONLY AI Competitive Advantage

TL;DR

中國真正的 AI 競爭優勢在於其成熟且相對便宜的核能發電容量和建設能力。這一優勢使中國能夠通過能源貿易,獲取無法跟上 AI 能源需求的國家的先進 GPU 和 AI 計算資源。這或許是中國在 AI 競爭中保持相關性的唯一機會。

在人工智慧的世界中,數據和計算能力是推動創新的雙引擎。儘管大部分的對話都圍繞著算法、模型和硬件進行,但有一個被忽視的隱藏力量——能源。像 OpenAI 的 GPT-4 這樣的 AI 模型需要大量的能源來進行訓練,而中國真正的競爭優勢或許不在於硅,而是在於某種更基本的東西:發電能力

AI 背後的能量

要了解能量的重要性,讓我們來看看一些數據。例如,訓練一個像 GPT-4 這樣的大型語言模型需要驚人的 51,773 兆瓦時(MWh)[^1]的能源——足以為一個美國家庭供電超過 5000 年。換句話說,這相當於讓 10,000 台 Nvidia Tesla V100 GPU 在 150 天內全速運行。

GPT-4 Energy Consumption

對於依賴先進 AI 開發的國家來說,能源帳單可能是天文數字的。而這正是中國被低估的優勢所在:其 核能發電能力

中國的核能優勢:一個被忽視的資產

截至 2024 年年中,中國擁有 56 座運營中的核反應堆,總裝機容量達到 58,218 MWe。僅在 2024 年上半年,這些反應堆就產生了令人印象深刻的 212,261,000 MWh 的電力。相比之下,訓練 GPT-4 所需的能量只佔中國在六個月內總核電輸出的 0.02%

但這還不是全部。中國已經批准了 11 座新的核反應堆,每座核反應堆的容量為 1,000 MWe,這將每年新增 85,628,220 MWh 的能源。簡而言之,中國即將能夠輕鬆地每年為多個 GPT-4 類模型的訓練提供電力——毫不費力

為什麼能源比以往更加重要

在 AI 競賽中,計算能力(用 FLOP/s 表示,即每秒浮點運算次數)是所有人關注的焦點。但這裡有個關鍵點:要將 FLOP/s 轉化為具體的 AI 能力,你需要大量的能源。

擁有豐富計算能力但缺乏能源的國家將面臨瓶頸。與此同時,中國仍在應對高端半導體技術的限制,但它擁有未被開發的能源儲備,這可能會重新定義其 AI 策略。儘管美國在晶片領域佔據主導地位,但中國正悄然成為 AI 能源超級大國

GPU-能源困境

Nvidia 的 Tesla V100 是 AI 領域的領先 GPU 之一,每台消耗約 300W 的電力。當規模擴展到像 GPT-4 訓練這樣的級別時,能源需求成為一個重要因素。對於運行大規模 GPU 集群的國家來說,能源費用很快就會失控。這給中國帶來了一個獨特的機遇。

儘管美國在 計算能力 方面佔據領先地位,但許多國家在 能源 方面面臨著嚴重的短缺。而這正是中國的 核反應堆 能夠發揮作用的地方。想像一下,中國利用其充足且便宜的核能,能夠將能源作為籌碼,換取無法跟上 AI 能源需求的國家的先進 GPU 和 AI 計算資源。

一種新策略出現了:通過將核能發電能力作為談判籌碼,中國可以將自己定位為 AI 驅動經濟體的不可或缺的能源供應者。與其在晶片生產上競爭,中國可以提供燃料——能源——來為全球的 AI 提供動力。

一種新的 AI 貨幣:能源

在美國的制裁使中國越來越難以獲得最先進的晶片和 GPU 的時代,中國可以通過將 能源作為貨幣 來扭轉局勢。與其依賴國內的晶片生產(目前受制於來自 ASML 的 EUV 光刻機的缺乏),中國可以與那些擁有高端計算資源但缺乏電力基礎設施的國家進行交易,將能源作為交換籌碼。

通過使用能源來換取計算資源,中國可以在不直接與美國競爭半導體製造的情況下,繼續在 AI 競爭中占據一席之地。這一策略不僅有助於中國規避制裁,還創造了一種新的經濟範式,在這種範式中,能源——而不僅僅是晶片——成為了 AI 世界中的關鍵貨幣

AI 競爭不僅僅關於晶片

展望未來,很明顯,AI 競爭將不僅僅由硅片決定。能源的可用性和消耗將成為擴展 AI 能力的決定性因素。憑藉其無與倫比的核能發電能力,中國可能不需要最先進的晶片就能在 AI 競賽中保持相關性——它只需要為世界上能源需求最大的 AI 模型提供動力

中美核能發電建設能力對比[^2]

國家/地區 核電廠型號 建設開始時間 預計並網時間 成本 (USD/kW) 建設週期 (年)
美國 AP1000 (Vogtle Units 3 & 4) 2013 2023 >12000 10
美國 AP1000 (後續項目) -- -- 8000 (批量生產時 5000) --
芬蘭 EPR (Olkiluoto Unit 3) 2005 2022 6750 17
法國 EPR (Flamanville Unit 3) 2007 2023 7700 16
英國 EPR (Hinkley Point C Units 1 & 2) 2018/2019 2027/2028 11100 10
印度 VVER-1200 (Kudankulam Units 3-6) 2017/2021 2023/2027 5200 6
中國 AP1000 (首座機組) -- -- 美國成本的1/4 ~ 2500 --
中國 AP1000 (批量生產) -- -- 美國成本的1/2.5~1/3 ~ 3000 至 4000 --

如果中國能夠批量建設 AP1000 反應堆,成本將為美國的 1/2.5 ~ 1/3,時間將為美國的 1/3,約 3000 ~ 4000 美元/kW。

如果中國建造一個專門用於訓練 GPT-4 模型的核反應堆?

GPT-4 的訓練時間約為五到六個月。因此,10,000 台Nvidia V100 全速運行 150 天,能耗約為 7200000000 瓦時,或者 7,200 MWh[^3]。

中國新核反應堆的平均容量為 1,000 MWe。假設運行的容量因數為 88.85%,這座反應堆全年運行的情況下將產生:

\[ \text{年發電量} = 1,000 \, \text{MWe} \times 88.85\% \times 24 \times 365 \]
\[ \text{年發電量} = 1,000 \times 0.8885 \times 8,760 \, \text{小時} = 7,780,860 \, \text{MWh/年} \]

因此,一座新的反應堆每年可產生 7,780,860 MWh

2. 訓練一個 GPT-4 模型所需的能源

訓練一個 GPT-4 模型所需的能量為 51,773 MWh

3. 計算一座核反應堆每年可以訓練多少 GPT-4 模型

現在,我們來計算一座核反應堆每年可以訓練多少個 GPT-4 模型:

\[ \text{GPT-4 模型數量} = \frac{7,780,860 \, \text{MWh/年}}{51,773 \, \text{MWh/GPT-4 模型}} \]
\[ \text{GPT-4 模型數量} = 150.24 \]

即,一座新的核反應堆每年可以訓練 150 個 GPT-4 模型

洞察🔥

目前 GPT-4 的訓練成本大約為 6300 萬美元[^6],假設中國的核能發電價格是美國的 1/3,那麼訓練成本將降至 2100 萬美元

結論

現在,美國的制裁限制了中國獲取 7nm 以下晶片,切斷了來自 ASML 的先進 EUV 光刻機,同時禁止 Nvidia 向中國出售頂級 GPU。中國最好的策略可能是專注於自己可以快速且廉價完成的事情——建造核反應堆。通過使用“能源/電力”作為信用體系,中國可以利用其豐富的能源來換取 GPU 和計算資源,這些國家雖然擁有技術,但難以滿足 AI 訓練的巨大能源需求。這一戰略轉變可以使中國在 AI 競爭中保持競爭力,儘管它面臨美國主導的西方集團的限制。

img

潛在的能源交易夥伴國家

中東、南亞/東盟非洲領先國家,等等。因為北約國家、澳大利亞、新西蘭、日本、韓國甚至台灣已經或即將進入美國主導的陣營。可交易的國家不多了,時間也不多了。