← 返回首页
硬件与芯片

后摩尔时代的 AI 算力革命

发布于 2026-02-04 • 作者:芯片观察员 • 阅读时间:10 分钟

随着半导体工艺逼近物理极限,摩尔定律的放缓已是不争的事实。然而,AI 大模型对算力的需求却在以每年 10 倍的速度增长。为了填补这一鸿沟,芯片架构正在经历一场前所未有的革命。

专用架构(DSA)的崛起

通用 GPU 虽然强大,但在能效比上已逐渐显露疲态。以 Groq、Cerebras 为代表的新兴势力,正在通过领域专用架构(Domain Specific Architecture)挑战英伟达的霸主地位。Groq 的 LPU(Language Processing Unit)通过确定性的数据流调度,实现了比传统 GPU 快 10 倍的 Token 生成速度,且无需依赖昂贵的 HBM(高带宽内存)。

存算一体:打破“内存墙”

数据在计算单元和内存之间的频繁搬运,消耗了 AI 计算中超过 60% 的能量。存算一体(Processing-in-Memory, PIM)技术试图将计算直接在内存中完成,从而彻底消除数据搬运的开销。三星和 SK 海力士最新的 HBM-PIM 产品已在部分数据中心开始试用,初步结果显示能效提升了 3-5 倍。

光子计算:速度与能耗的终极解?

光子计算利用光代替电子进行矩阵乘法运算,理论上具有高带宽、低延迟和极低功耗的优势。尽管目前仍面临集成度和制造工艺的挑战,但曦智科技等初创公司已成功流片了基于光子计算的 AI 加速卡,并在图像识别任务中展现出了潜力。

未来展望

后摩尔时代的算力竞争,不再是单纯的晶体管数量比拼,而是架构创新、先进封装和互联技术的综合较量。对于 AI 开发者而言,这或许意味着未来我们将拥有更多样化、更具性价比的算力选择。