要点:
Google Research 确实发表了 TurboQuant 技术,AI 内存使用量减少 6 倍,速度提升 8 倍。
“浏览器分页”陷阱:为什么 Google 的 TurboQuant 突破无法终结 AI 内存热潮?
2026 年 3 月 24 日,Google Research 发布了一项震惊业界的 기술:TurboQuant。这套全新的算法(包含 PolarQuant 与 QJL)能将 AI 的短期内存——即“键值缓存”(KV Cache)——压缩至仅剩 3 比特(3-bit),且标榜完全不损失模型精准度。
数据表现令人咋舌:在 NVIDIA H100 GPU 上,这项技术能让内存占用减少 6 倍,且推论速度提升 8 倍。消息一出,华尔街一度陷入恐慌:如果 AI 突然间不再需要那么多 RAM 就能运作,这是否意味着内存产业的“超级周期”即将结束?Google 是否会因此减少向美光(Micron)采购芯片?
答案是否定的。事实上,从历史规律与经济学角度来看,情况正好相反。要理解这一点,我们只需要观察你电脑上的网页浏览器。
浏览器分页的悖论
回想一下早期使用电脑的经验。如果你有一台只有 8GB RAM 的电脑,你可能开到 10 个浏览器分页 系统就开始变得卡顿甚至死机。那时你必须非常有纪律:每开一个新分页,就得先关掉一个旧的。
后来,Google 和微软优化了浏览器效率,同样的 10 个分页现在只占用一半的内存。你会因此心满意足地维持在 10 个分页,然后享受剩余的内存吗?当然不会。 相反地,你会开始同时开启 50 个分页。你一边查资料,一边开着 YouTube 影片,还背景运行着高负载的网页应用程序。没过多久,你又达到了硬件极限,最终你发现即使软件变有效率了,你还是得去买一条 32GB 的 RAM 来升级,才能满足你愈发贪婪的使用习惯。
在经济学中,这被称为 “杰文斯悖论”(Jevons Paradox):当某种资源的使用效率提高时,我们通常不会减少使用,反而会开发出更多雄心勃勃的新用途,导致总消耗量不减反增。
杰文斯悖论首先在 1865 年的《煤炭问题》一书中描述。杰文斯观察到,詹姆斯·瓦特引进瓦特蒸汽机后,英国的煤炭消费量大幅上涨,这使得托马斯·纽科门早期的设计大大提高了燃煤蒸汽发动机的效率。瓦特的创新使得煤炭成为更具成本效益的动力源,从而在广泛的行业中增加了蒸汽机的使用。这反过来又增加了总的煤炭消耗,即使任何特定应用所需的煤量下降。杰文斯认为,燃料效率的提高往往会增加(而不是减少)。
经济学家观察到,当汽车的燃油效率更高时,消费者往往会越来越多,导致燃料需求的“反弹”。使用资源(例如燃料)的效率的提高导致当根据可实现的程度(例如旅行)测量时,使用该资源的成本降低。一般来说,成本(或价格)的降低会使物品或服务的数量增加(需求规律)。随着旅行成本的降低,消费者将会越来越多地旅行,增加对燃料的需求。这种需求的增长被称为反弹效应,可能足以抵消原来的需求下降从提高的效率。当反弹效应大于 100% 时,杰文斯悖论就会发生,超过原来的效率增益。

为什么 TurboQuant 反而是 DRAM 需求的“助燃剂”?
Google 的 TurboQuant 就像是 AI 界的“浏览器效率更新”。通过缩减 LLM 的内存占用,Google 并非消灭了内存需求,而是解锁了许多过去因“成本太贵”而无法实现的 AI 应用。
千万级别的“上下文窗口”(Context Window):
在 TurboQuant 出现前,要让 AI 拥有 100 万个 token 的记忆力是一项巨大的硬件挑战,需要耗费大量的 HBM 内存。现在有了 6 倍压缩率,开发者并不会把省下的内存存起来,而是会直接填满它。我们正从“能读一篇文章的 AI”,迈向“能一次记住整个图书馆、或公司过去十年电子邮件的 AI”。
“代理型 AI”(Agentic AI)的崛起:
2026 年的 AI 显学是“代理型 AI”——这种模型不只是回答问题,而是像员工一样持续运作数小时甚至数天,协助开发复杂的程序专案。这些代理人需要长期驻留在 RAM 中随时待命。TurboQuant 让同时执行数千个这类代理人变得经济实惠,这进而产生了过去单纯聊天机器人时代所没有的、庞大且持续的 DRAM 需求。
美光 2026 年产能早已售罄
如果市场真的认为 TurboQuant 会降低需求,美光的股价应该会崩盘。然而事实是,美光已正式宣布其 HBM4(高带宽内存) 的 2026 全年产能已经 100% 售罄。
包括 Google、Meta 与微软在内的三大巨头,目前正为了争夺美光生产的每一片晶圆而大打价格战。他们深知 TurboQuant 能让 AI 速度提升 8 倍,而在 AI 领域,速度就等于获利。AI 思考越快,能服务的使用者就越多,也就需要采购更多的 RAM 来支撑这份全球化的规模。
结论:效率是倍数器,而非替代品
Google 的这项突破是工程上的壮举,但对硬件产业而言绝非威胁。就像你桌面上那些永远关不掉的浏览器分页一样,AI 的胃口永远会扩张到填满我们所提供的每一个空间。
但有时人类的恐惧是不合逻辑的,市场对头条新闻的反应也是如此。