logo

三張圖看英偉達GTC:算力越便宜,花得越多

By: blockbeats|2026/03/17 13:00:06
0
分享
copy

黃仁勳昨晚在 GTC 2026 上發布了 Vera Rubin 平台,宣稱單位功耗推理性能比 Blackwell 提升 10 倍,推理 Token 成本降到十分之一,並預告 Blackwell 與 Vera Rubin 的合併訂單將在 2027 年前突破 1 萬億美元。

過去兩年,GPT-4 同級 API 的推理成本跌了 94%,從每百萬 Token 36 美元降到不到 2 美元。按照直覺,算力變便宜了,企業應該少花錢才對。但 Amazon、Alphabet、Meta、Microsoft 四家雲廠商的資本支出合計從 1540 億美元漲到了 4160 億美元,翻了將近 3 倍。

黃仁勳的萬億預告不是一句行銷話術,它背後有一條可以用數據畫出來的曲線。

每一代都讓上一代顯得可悲

從 2022 年的 H100 到 2026 年下半年即將量產的 Vera Rubin,英偉達 AI GPU 的 FP8 密集推理算力在四年間翻了 8 倍。據 NVIDIA 官方規格,H100 單卡 2.0 PetaFLOPS,B200 達到 4.0 PF,Vera Rubin 直接跳到 16 PF。

三張圖看英偉達GTC:算力越便宜,花得越多

但不是每一代的跳躍都來自同一個地方。據 wccftech 報道,H200 的計算核心和 H100 完全一樣,FP8 算力沒有變化,它的升級全部來自內存帶寬(從 3.35 TB/s 提升到 4.8 TB/s),帶來約 45% 的推理吞吐提升。

真正的架構換代發生在 B200 和 Vera Rubin。Vera Rubin 採用台積電 3nm 製程,搭載 336B 晶體管的雙 chiplet 設計,FP4 精度下推理算力達到 50 PF。據 Tom's Hardware 報道,第一台 Vera Rubin 系統已經在微軟 Azure 上運行。

這裡有一個容易被忽略的區分。黃仁勳在 GTC 上說的「10 倍」指的是推理 Token 成本的降低,不是原始算力的倍數。Token 成本包含了 Transformer Engine 優化、FP4 精度、更大批量推理等系統級因素。從標準化的 FP8 密集 TFLOPS 來看,Vera Rubin 相對 Blackwell 的倍數是 4 倍,相對 H100 是 8 倍。

這條曲線的斜率從未放緩。每一代 GPU 都讓上一代顯得不夠用,而這正是接下來要講的故事的起點。

Jevons 悖論:算力越便宜,花得越多

2023 年 3 月 GPT-4 剛上線時,API 調用成本是每百萬 Token 約 36 美元。據 OpenAI 官方定價歷史,到 2024 年中 GPT-4o 推出時降到約 7 美元,2025 年末實際可用價格已經低於 2 美元。兩年間降幅超過 94%。

按照常理,推理成本跌了這麼多,企業應該花得更少了。但現實完全相反。據各公司財報及 Platformonomics 追踪數據,Amazon、Alphabet、Meta、Microsoft 四家雲廠商的年度資本開支合計從 2023 年的 1540 億美元漲到 2025 年的 4160 億美元,增幅 170%。其中 Google 單獨從 320 億漲到 915 億(約 2.9 倍),Microsoft 的增幅更大。

這個現象在經濟學裡有個名字,叫 Jevons 悖論。1865 年,英國經濟學家 William Jevons 發現,瓦特改良蒸汽機讓煤炭使用效率大幅提高,但英國的煤炭消耗量不降反升。原因很簡單,效率提升讓蒸汽機變得更划算,於是更多行業開始使用蒸汽機,總需求膨脹到遠超效率節省的部分。

今天 AI 推理的情況一模一樣。API 價格跌到原來的 6%,企業沒有因此省下預算,而是開始把 AI 塞進之前成本上不划算的場景。客服、代碼審查、內容生成、搜索重排序、廣告出價,每一個新場景都在消耗更多的推理算力。需求的膨脹速度遠遠超過成本下降的速度。DeepSeek R1 在 2025 年初把輸入價格壓到每百萬 Token 0.55 美元,進一步加速了這個循環。圖上那兩條反向運動的線,就是同一件事的兩面。

三年 11 倍,且沒有看到天花板

如果 Jevons 悖論有一個最直接的受益者,那就是賣鏟子的人。

据 NVIDIA 财报,数据中心业务年收入从 FY2022(截至 2022 年 1 月)的 1060 億美元,涨到 FY2025(截至 2025 年 1 月)的 11520 億美元。三个财年,10.9 倍。这条增速曲线在科技史上几乎没有先例。作为对比,iPhone 在 2007 年上市后,蘋果用了大約 6 年時間才實現了類似量級的收入規模增幅。

然后黃仁勳在 GTC 2026 上說:「到 2027 年,我看到的可見訂單至少有 1 萬億美元。事實上,我們的產能會不夠。我確信計算需求會遠超這個數字。」

去年 GTC 他給出的預測是通過 2026 年可見訂單約 5000 億美元。一年之後,數字翻倍,時間窗口只延長了一年。分析師對 FY2026-FY2027 的營收預測區間分別在 1600-2200 億和 2500-4000 億美元之間。而黃仁勳自己說的是,這個數字不是天花板,「計算需求會遠超這個數字」。GTC 結束當天,NVIDIA 股價上漲 4.3%。市場顯然選擇了相信他。

每一代 GPU 都讓上一代顯得可悲,每一輪降價都讓下一輪資本開支顯得理所當然。英偉達正站在這個悖論最甜蜜的位置上。

-- 價格

--

猜你喜歡

為何擁有百萬粉絲的加密貨幣KOL選擇WEEX VIP?

了解頂級加密貨幣KOL卡爾·穆恩(Carl Moon)為何選擇與WEEX合作。探索 WEEX VIP 生態系統、1,000 BTC 資金保障,以及專為資深交易者準備的獨家獎勵。

CoinEx創始人:在我看來,加密貨幣的終局是怎樣的?

這個行業不會消失,但規模會大幅縮減。

眼看 Aave 樓塌了,眼看 Spark 起高樓

Spark 的 TVL 增長,本質上是 DeFi 存量資金在協議之間的重新分配,而非新增資本入場。整個行業的“蛋糕”在短期內縮小,沒有人能置身事外。

什麼是Memecoin交易?新手指南:運作方式、風險及2026年最熱門代幣

2026年初,模因幣價格飆升30%以上,而比特幣則保持穩定。RAVE指數在幾天內飆升4500%,然後暴跌90%。MAGA隔夜漲幅達350%。本指南將詳細解釋模因幣交易的運作方式,以及如何避免爆帳戶。

特朗普延長停火協議:比特幣價格突破 7.9 萬美元——加密貨幣交易者現在需要了解什麼

特朗普無限期延長停火後,比特幣飆升至 79,000 美元以上。我們將詳細分析事件經過、各大加密貨幣的反應,以及交易者接下來應該關注的重點——包括可能引發比特幣價格飆升至 85,000 美元的關鍵價位。

CHIP 加密貨幣價格預測 2026:USD.AI 的 GPU 借貸代幣能達到 1 美元嗎?

CHIP 的 24 小時交易量達到 18.7 億美元,市值達到 2.36 億美元——8 倍的比率在合法代幣中幾乎從未出現過。我們將解釋其背後的驅動因素、USD.AI 對 GPU 代幣化的實際作用,以及 CHIP 是否應該納入您的 AI 加密貨幣投資組合。

熱門幣種

最新加密貨幣要聞

閱讀更多