随着AI模型规模的持续膨胀,HBM(高带宽内存)未来可能难以满足计算卡对超大容量显存的需求。为此,业界正将“GPU直接驱动存储”视作突破瓶颈的下一技术前沿。例如,早有消息称英伟达已分别与SK海力士、铠侠合作,共同开发AI专用SSD,旨在用定制化的固态硬盘部分替代HBM,成为GPU显存的有效扩展。

为应对相同挑战,SK海力士今年携手闪迪,推出了面向AI推理场景的下一代存储器解决方案——HBF(高带宽闪存)。据调研机构TrendForce最新报道,英伟达正积极推进GPU直接访问存储(GPU-Initiated Direct Storage Access, 简称GIDS)的架构开发,计划从Vera Rubin平台开始引入该功能。分析普遍认为,此举或将加速HBF等新存储方案的发展。
GIDS与现有的GDS(GPU Direct Storage)技术存在显著区别。在GDS架构中,数据传输至GPU前需由CPU向存储设备发出请求;而GIDS则允许GPU直接发起访问,完全跳过CPU与DRAM作为中介,从而实现更高效的数据流。
GIDS与GDS的最终目标,都是克服传统计算架构中的数据搬移瓶颈。据信微软和AMD也在探索类似的技术路径。核心问题在于,传统由CPU调度线程的数据传输模式效率有限,而GPU却能生成数以万计的并行线程。当前,GPU与HBM之间的数据传输能耗已占据系统总功耗近半,这为将HBF等超高速NAND闪存部署至更贴近GPU的位置,以应对未来的AI性能瓶颈提供了有力支持。
GIDS架构的出现,有望让NAND闪存在AI存储系统中扮演更为关键的角色,同时缓解HBM在容量方面面临的压力。这种转变也对NAND闪存的性能提出了更高要求,以匹配GPU的处理速度。相较于DRAM,NAND闪存的优势在于其位密度可达前者的30倍左右,能够在相近的芯片面积下实现更大的存储容量。
然而,NAND闪存存在写入寿命有限的短板,而DRAM则拥有几乎无限的写入能力。因此,HBF等新方案被认为更适用于存储相对固定的AI模型参数,这部分数据在推理过程中基本保持不变,属于典型的“只读”工作负载,从而规避了耐久度挑战。


















