处理单元(CPU、GPU 等)和 RAM 通常是独立的东西,构建在不同的芯片上。但如果它们是同一芯片的一部分,混合在一起会怎么样?三星正是这样做的,创造了世界上第一个内置 AI 处理硬件的高带宽内存 (HBM),称为 HBM-PIM(内存处理)。 它采用了 HBM2 Aquabolt 芯片,并在内存库之间添加了可编程计算单元 (PCU)。这些单元相对简单,使用有限的指令集对 16 位浮点值进行操作 - 它们可以移动数据并执行乘法和加法。
但 PCU 数量众多,它们实际上就位于正在处理的数据旁边。三星设法让 PCU 以 300 MHz 的速度运行,相当于每芯片 1.2 TFLOPS 的处理能力。并且它保持了(每芯片)功耗不变,同时以每针 2.4 Gbps 的速度传输数据。 每个芯片的功耗可能相同,但整体系统能耗下降了 71%。这是因为典型的 CPU 需要移动数据两次 - 读取输入然后写入结果。使用 HBM-PIM,数据实际上不会移动到任何地方。 这不仅仅是省电,研究人员使用 PIM 进行机器学习和推理任务时发现系统性能提高了一倍以上。这是一个双赢的局面。 HBM-PIM 设计向后兼容常规 HBM2 芯片,因此无需开发新硬件 - 软件只需要告诉 PIM 系统从常规模式切换到内存处理模式。 这样做有一个问题,那就是 PCU 占用了之前内存组占用的空间。这导致总容量减半——降至 4 千兆位。三星决定折中这一差额,将 4 千兆位 PIM 芯片与 8 千兆位常规 HBM2 芯片结合起来。使用其中四个,它创建了 6 千兆字节堆栈。 还有一些坏消息——HBM-PIM 还需要一段时间才能应用于消费硬件。目前,三星已将芯片发送给开发 AI 加速器的合作伙伴进行测试,预计该设计将在 7 月得到验证。 HBM-PIM 将于本周在国际固态电路虚拟会议上展出,因此我们可以期待届时获得更多细节。 来源 | Via |
>>: 微软终于让其 Office 应用对 iPadOS 进行了优化
如果您曾经想实时向其他人展示您在三星 Gear VR 耳机中看到的内容,那么这款应用就是您的不二之选...
Realme 的 Realme 2 Pro 发布会带来了惊喜,因为该公司最终发布了第二款手机——价格...
联想更新了其小巧实惠的平板电脑系列,推出了 Tab 7 和 Tab 7 Essential。这两款产...
Palm Pre 领先于时代——它为移动世界引入了无线充电。不幸的是,尽管它进行了诸多创新,但这款手...
这是 vivo iQOO 3 5G,刚刚抵达总部。我们开始对其进行评测,但在测试手机的同时,我们决定...
三星 Galaxy M10 将是新 M 系列中最小的一款,但这并不意味着它就不重要了。手册中泄露的规...
到目前为止,魅族 16 系列智能手机预计将于 8 月上市。然而,最新进展表明这些设备可能会更早上市。...
OnePlus 发布了针对去年和今年的智能手机(OnePlus 6、6T、7 和 7 Pro)的 ...
Redmi K40 和 K40 Pro 将于 2 月 25 日发布。要等这么久才能看到规格——Pr...
据报道,诺基亚已经开始发出 8 月 16 日活动邀请,届时将正式发布诺基亚 8。这将是诺基亚三年来的...
继 Galaxy S6 edge+ 之后,三星开始在印度为其 Galaxy S6 和 S6 edge...
vivo 将于 3 月 19 日发布 vivo X27,得益于 TENAA,我们已经知道这款智能手机...
三星可能已经简化了其中端产品线,只保留了 A 系列和 M 系列,但这两个系列最近都变得越来越拥挤。而...