硬件与芯片

后摩尔时代的 AI 算力革命

发布于 2026-02-04 • 作者：芯片观察员 • 阅读时间：10 分钟

随着半导体工艺逼近物理极限，摩尔定律的放缓已是不争的事实。然而，AI 大模型对算力的需求却在以每年 10 倍的速度增长。为了填补这一鸿沟，芯片架构正在经历一场前所未有的革命。

专用架构（DSA）的崛起

通用 GPU 虽然强大，但在能效比上已逐渐显露疲态。以 Groq、Cerebras 为代表的新兴势力，正在通过领域专用架构（Domain Specific Architecture）挑战英伟达的霸主地位。Groq 的 LPU（Language Processing Unit）通过确定性的数据流调度，实现了比传统 GPU 快 10 倍的 Token 生成速度，且无需依赖昂贵的 HBM（高带宽内存）。

存算一体：打破“内存墙”

数据在计算单元和内存之间的频繁搬运，消耗了 AI 计算中超过 60% 的能量。存算一体（Processing-in-Memory, PIM）技术试图将计算直接在内存中完成，从而彻底消除数据搬运的开销。三星和 SK 海力士最新的 HBM-PIM 产品已在部分数据中心开始试用，初步结果显示能效提升了 3-5 倍。

光子计算：速度与能耗的终极解？

光子计算利用光代替电子进行矩阵乘法运算，理论上具有高带宽、低延迟和极低功耗的优势。尽管目前仍面临集成度和制造工艺的挑战，但曦智科技等初创公司已成功流片了基于光子计算的 AI 加速卡，并在图像识别任务中展现出了潜力。

未来展望

后摩尔时代的算力竞争，不再是单纯的晶体管数量比拼，而是架构创新、先进封装和互联技术的综合较量。对于 AI 开发者而言，这或许意味着未来我们将拥有更多样化、更具性价比的算力选择。