‌英伟达推GPU直访存储技术缓解AI显存瓶颈‌

　　随着AI模型规模的持续膨胀，HBM(高带宽内存)未来可能难以满足计算卡对超大容量显存的需求。为此，业界正将“GPU直接驱动存储”视作突破瓶颈的下一技术前沿。例如，早有消息称英伟达已分别与SK海力士、铠侠合作，共同开发AI专用SSD，旨在用定制化的固态硬盘部分替代HBM，成为GPU显存的有效扩展。

　　为应对相同挑战，SK海力士今年携手闪迪，推出了面向AI推理场景的下一代存储器解决方案——HBF(高带宽闪存)。据调研机构TrendForce最新报道，英伟达正积极推进GPU直接访问存储(GPU-Initiated Direct Storage Access, 简称GIDS)的架构开发，计划从Vera Rubin平台开始引入该功能。分析普遍认为，此举或将加速HBF等新存储方案的发展。

　　GIDS与现有的GDS(GPU Direct Storage)技术存在显著区别。在GDS架构中，数据传输至GPU前需由CPU向存储设备发出请求;而GIDS则允许GPU直接发起访问，完全跳过CPU与DRAM作为中介，从而实现更高效的数据流。

　　GIDS与GDS的最终目标，都是克服传统计算架构中的数据搬移瓶颈。据信微软和AMD也在探索类似的技术路径。核心问题在于，传统由CPU调度线程的数据传输模式效率有限，而GPU却能生成数以万计的并行线程。当前，GPU与HBM之间的数据传输能耗已占据系统总功耗近半，这为将HBF等超高速NAND闪存部署至更贴近GPU的位置，以应对未来的AI性能瓶颈提供了有力支持。

　　GIDS架构的出现，有望让NAND闪存在AI存储系统中扮演更为关键的角色，同时缓解HBM在容量方面面临的压力。这种转变也对NAND闪存的性能提出了更高要求，以匹配GPU的处理速度。相较于DRAM，NAND闪存的优势在于其位密度可达前者的30倍左右，能够在相近的芯片面积下实现更大的存储容量。

　　然而，NAND闪存存在写入寿命有限的短板，而DRAM则拥有几乎无限的写入能力。因此，HBF等新方案被认为更适用于存储相对固定的AI模型参数，这部分数据在推理过程中基本保持不变，属于典型的“只读”工作负载，从而规避了耐久度挑战。

‌英伟达推GPU直访存储技术缓解AI显存瓶颈‌

推荐游戏

推荐内容

‌英伟达推GPU直访存储技术 缓解AI显存瓶颈‌

推荐游戏

推荐内容

‌英伟达推GPU直访存储技术缓解AI显存瓶颈‌