要點:
Google Research 確實發表了 TurboQuant 技術,AI 記憶體使用量減少 6 倍,速度提升 8 倍。
「瀏覽器分頁」陷阱:為什麼 Google 的 TurboQuant 突破無法終結 AI 記憶體熱潮?
2026 年 3 月 24 日,Google Research 發布了一項震驚業界的技術:TurboQuant。這套全新的演算法(包含 PolarQuant 與 QJL)能將 AI 的短期記憶——即「鍵值快取」(KV Cache)——壓縮至僅剩 3 位元(3-bit),且標榜完全不損失模型精準度。
數據表現令人咋舌:在 NVIDIA H100 GPU 上,這項技術能讓記憶體佔用減少 6 倍,且推論速度提升 8 倍。消息一出,華爾街一度陷入恐慌:如果 AI 突然間不再需要那麼多 RAM 就能運作,這是否意味著記憶體產業的「超級週期」即將結束?Google 是否會因此減少向美光(Micron)採購晶片?
答案是否定的。事實上,從歷史規律與經濟學角度來看,情況正好相反。要理解這一點,我們只需要觀察你電腦上的網頁瀏覽器。
瀏覽器分頁的悖論
回想一下早期使用電腦的經驗。如果你有一台只有 8GB RAM 的電腦,你可能開到 10 個瀏覽器分頁 系統就開始變得卡頓甚至當機。那時你必須非常有紀律:每開一個新分頁,就得先關掉一個舊的。
後來,Google 和微軟優化了瀏覽器效率,同樣的 10 個分頁現在只佔用一半的記憶體。你會因此心滿意足地維持在 10 個分頁,然後享受剩餘的記憶體嗎?當然不會。 相反地,你會開始同時開啟 50 個分頁。你一邊查資料,一邊開著 YouTube 影片,還背景執行著高負載的網頁應用程式。沒過多久,你又達到了硬體極限,最終你發現即使軟體變有效率了,你還是得去買一條 32GB 的 RAM 來升級,才能滿足你愈發貪婪的使用習慣。
在經濟學中,這被稱為 「謝雲斯悖論」(Jevons Paradox):當某種資源的使用效率提高時,我們通常不會減少使用,反而會開發出更多野心勃勃的新用途,導致總消耗量不減反增。
謝雲斯的悖論首先在1865年的「煤炭問題」一書中描述。謝雲斯觀察到,詹姆斯·瓦特引進瓦特蒸汽機後,英國的煤炭消費量大幅上漲,這使得湯瑪斯·紐科門早期的設計大大提高了燃煤蒸汽發動機的效率。瓦特的創新使得煤炭成為更具成本效益的動力源,從而在廣泛的行業中增加了蒸汽機的使用。這反過來又增加了總的煤炭消耗,即使任何特定應用所需的煤量下降。謝雲斯認為,燃料效率的提高往往會增加(而不是減少)。
經濟學家觀察到,當汽車的燃油效率更高時,消費者往往會越來越多,導致燃料需求的「反彈」。使用資源(例如燃料)的效率的提高導致當根據可實現的程度(例如旅行)測量時,使用該資源的成本降低。一般來說,成本(或價格)的降低會使物品或服務的數量增加(需求規律)。隨着旅行成本的降低,消費者將會越來越多地旅行,增加對燃料的需求。這種需求的增長被稱為反彈效應,可能足以抵消原來的需求下降從提高的效率。當反彈效應大於100%時,謝雲斯的悖論就會發生,超過原來的效率增益。

為什麼 TurboQuant 反而是 DRAM 需求的「助燃劑」?
Google 的 TurboQuant 就像是 AI 界的「瀏覽器效率更新」。透過縮減 LLM 的記憶體佔用,Google 並非消滅了記憶體需求,而是解鎖了許多過去因「成本太貴」而無法實現的 AI 應用。
千萬級別的「上下文視窗」(Context Window):
在 TurboQuant 出現前,要讓 AI 擁有 100 萬個 token 的記憶力是一項巨大的硬體挑戰,需要耗費大量的 HBM 記憶體。現在有了 6 倍壓縮率,開發者並不會把省下的記憶體存起來,而是會直接填滿它。我們正從「能讀一篇文章的 AI」,邁向「能一次記住整個圖書館、或公司過去十年電子郵件的 AI」。
「代理型 AI」(Agentic AI)的崛起:
2026 年的 AI 顯學是「代理型 AI」——這種模型不只是回答問題,而是像員工一樣持續運作數小時甚至數天,協助開發複雜的程式專案。這些代理人需要長期駐留在 RAM 中隨時待命。TurboQuant 讓同時執行數千個這類代理人變得經濟實惠,這進而產生了過去單純聊天機器人時代所沒有的、龐大且持續的 DRAM 需求。
美光 2026 年產能早已售罄
如果市場真的認為 TurboQuant 會降低需求,美光的股價應該會崩盤。然而事實是,美光已正式宣布其 HBM4(高頻寬記憶體) 的 2026 全年產能已經 100% 售罄。
包括 Google、Meta 與微軟在內的三大巨頭,目前正為了爭奪美光生產的每一片晶圓而大打價格戰。他們深知 TurboQuant 能讓 AI 速度提升 8 倍,而在 AI 領域,速度就等於獲利。AI 思考越快,能服務的使用者就越多,也就需要採購更多的 RAM 來支撐這份全球化的規模。
結論:效率是倍數器,而非替代品
Google 的這項突破是工程上的壯舉,但對硬體產業而言絕非威脅。就像你桌面上那些永遠關不掉的瀏覽器分頁一樣,AI 的胃口永遠會擴張到填滿我們所提供的每一個空間。
但有時人類的恐懼是不合邏輯的,市場對頭條新聞的反應也是如此。