SHMT技术推动计算变革:不动硬件,速度翻番、能耗减半

发布时间:2024-2-25 11:02    发布者:eechina
关键词: SHMT
来源:IT之家

在第 56 届 IEEE / ACM 微体系结构国际研讨会上,美国加州大学河滨分校(UCR)的研究人员展示了一种全新的方法,可以实现计算速度翻番、能耗减半的效果。

研究人员表示这项技术理论上适用于从智能手机到数据中心服务器的任何处理器和加速器,但需要进一步地开发适配。

加利福尼亚大学电气与计算机工程系副教授、本研究报告的共同作者曾宏伟(Hung-Wei Tseng)表示:

你不需要增加新的处理器,可以在现有计算机平台上部署。这项技术的核心,是帮助你更合理高效地管理可用硬件资源。

研究人员开发的平台打破了传统的编程模式,团队将其称为同步异构多线程(SHMT)。传统编程模式是在一段时间内,只向系统的一个计算组件(中央处理器、图形处理器、张量处理器或其他处理器或加速器)提供数据,而 SHMT 技术在所有组件之间同时并行执行代码。

1.jpg
传统、现代异构和 SHMT 的并行化方法比较

SHMT 采用质量感知工作偷取(QAWS)调度策略,保持平衡控制计算质量和工作负载,因此降低了资源调用。

SHMT runtime 系统将创建一组虚拟操作(vOPS),并划分为一个或多个高级操作(HLOP),以便同时使用多个硬件资源。

2.jpg
根据所选政策加速 SHMT 计算

3.jpg
传统计算与 SHMT 的活动和闲置消耗比较

SHMT runtime 系统将 HLOPS 分配到任务队列,在目标硬件上运行。由于 HLOPS 与硬件无关,runtime 系统可根据需要将任务重定向到计算平台的一个或另一个组件。

研究人员以他们创建的测试平台为例,展示了新软件库的有效性。他们创造了一种混合体,既可以被视为智能手机,也可以被视为一种个人电脑,甚至是服务器。

4.jpg

该测试平台基于一块带有 PCIe 接口的背板,一台搭载英伟达 Nano Jetson 模块组的“计算单元”,通过 M.2 Key E 插槽连接谷歌 Edge 加速器(TPU)。该模块带有四核 ARM Cortex-A57 处理器(CPU)和 128 个 Maxwell 架构图形内核(GPU)。

本系统的主内存为 4 GB LPDDR4,频率为 1600 MHz,速度为 25.6 Gbps,用于存储一般数据。Edge TPU 模块额外包含 8 MB 内存,并使用 Ubuntu Linux 18.04 作为操作系统。

在一个使用标准测试应用程序的简易异构平台上运行 SHMT 软件包的结果表明,与基本计算分配方法相比,采用最有效策略的 QAWS 框架的计算速度提高了 1.95 倍,消耗显著降低了 51%。

这种方法如果应用于数据中心,可以在保持现有硬件不变的情况下,最大化性能收益。目前,所提出的解决方案尚未准备好付诸实施,但肯定会有很多人对此感兴趣。
本文地址:https://www.eechina.com/thread-851684-1-1.html     【打印本页】

本站部分文章为转载或网友发布,目的在于传递和分享信息,并不代表本网赞同其观点和对其真实性负责;文章版权归原作者及原出处所有,如涉及作品内容、版权和其它问题,我们将根据著作权人的要求,第一时间更正或删除。
您需要登录后才可以发表评论 登录 | 立即注册

厂商推荐

关于我们  -  服务条款  -  使用指南  -  站点地图  -  友情链接  -  联系我们
电子工程网 © 版权所有   京ICP备16069177号 | 京公网安备11010502021702
快速回复 返回顶部 返回列表