
2026年4月,我注意到一个不算新但最近变得特别密集的现象:几乎每家发布智能驾驶芯片的公司,都在强调自己的算力突破了千T(每秒一千万亿次运算)。蔚来的神玑NX9031,英伟达的Thor,还有几家国内新势力的产品,参数表上的数字一个比一个高。但说实话,我有点怀疑我们是不是在追求一个不太对的方向。
这个疑问来自一个简单的观察:过去两年,我对比了大概十来款搭载不同算力芯片的智能驾驶车型。从实际道路表现看,400T到800T之间的车型,在常规城市道路和高速上的辅助驾驶表现,差异远没有参数表上那么明显。有些800T芯片的车型,反倒因为算法优化不到位,出现顿挫或误判的情况。
一个反常识的推测是:对于2026年主流的L2+到L3级自动驾驶,峰值算力的过度堆砌可能已经进入收益递减区间。芯片厂商用千T数字来吸引车厂,车厂再用它来吸引消费者,但终端用户真正感受到的体验提升,可能只用了标称算力的不到一半。
我之前也信“算力即正义”这个逻辑。毕竟自动驾驶需要处理那么多摄像头、雷达和激光雷达的数据,算力不够怎么行。但后来我仔细看了一些公开的算法效率报告,发现一个问题:很多芯片的实际利用率常年徘徊在30%到50%之间。也就是说,一颗标称1000T的芯片,大部分时间只用到了300T到500T。


这个现象让我重新思考了算力竞赛背后的驱动力。可能的原因有两个。一个是商业上的:芯片公司需要定期推新一代产品来维持高毛利,而制程工艺进步能让晶体管数量继续增加,最直观的卖点就是把TOPS数字做上去。另一个是技术上的:目前的AI算法模型还在快速演进,谁也不敢保证明年不会出现一个需要暴力算力的新架构,所以先备着总没错。
有意思的是,我最近翻了一些2025年底到2026年初的学术预印本,发现一个正在兴起的思路叫“算法-硬件协同设计”。简单说,与其在单颗芯片上堆一万个计算单元,不如把模型剪枝、量化和稀疏计算做到极致,让同样算力发挥两三倍的效果。有几家创业公司已经拿出了原型方案,在约七成的实际场景中,用不到400T的等效算力跑出了以前需要800T才能完成的任务。
但从另一个角度说,千T算力的军备竞赛也并非完全没有道理。在顶级L4级自动驾驶的研发测试中,需要同时运行多个冗余模型和仿真验证,峰值负载确实可能接近1000T。另外,车内座舱和车控开始融合,大型语言模型上车后,也需要分走一部分算力。所以问题可能不是“千T有没有用”,而是“对谁有用”。

我对这个现象的平衡观点是这样的:对于量产车而言,2026年这个时间点,盲目追逐千T而忽视能效比和算法适配,就像买一台拥有两千马力的家用轿车,在拥挤的城市街道上根本发挥不出来。但完全拒绝算力升级,也会错失关键技术窗口。下图是我根据公开资料整理的一个粗略对比,展示了三种常见做法在2026年4月前后的侧重点变化:
| 对比维度 | 激进堆算力 | 追求利用率 | 协同优化 |
|---|---|---|---|
| 峰值TOPS | 超过1000T | 约500T | 600-800T |
| 典型利用率 | 不到四成 | 约七成 | 大概八成以上 |
| 落地车型占比 | 约三成 | 不到两成 | 增长最快 |
从实际落地的角度看,2026年做智能驾驶芯片的公司面临一个很现实的约束:车厂的采购成本。一颗千T级别的大芯片,单颗成本动辄几百美元,加上配套的存储和散热,在十几万到二十万价位的主销车型上根本用不起。所以会出现一个分化:高端车型堆算力立flag,中低端车型用更实惠的几百T方案满足基本需求。
我不确定这个算力竞赛会持续多久。也许明年某家头部企业直接量产2000T的芯片,大家再跟一轮。但从更长期的视角看,真正的瓶颈可能不在硅片上,而在于我们是否找到了让算法和硬件停止“互相等待”的突破口。一个开放的问题是:当芯片算力增长曲线和算法效率增长曲线终将交汇时,哪里才是我们真正该投注资源的地方?