您现在的位置是:首页 > 财经网站首页财经
持续的数据供应确保数据密集型模拟能够以最高速度运行
- 财经
- 2021-12-01 20:51:44
- 来源:
KAUST研究人员开发的抢占式内存管理系统可以消除数据传输缓慢带来的延迟,从而将数据密集型模拟的速度提高2.5倍。这种开发优雅而透明地解决了现代超级计算中最顽固的瓶颈之一,即从内存中传递数据的速度要足以跟上计算速度。
研究团队的Hatem Ltaief解释说:“减少数据的移动,同时保持数据和计算硬件之间的距离,是计算科学家处理大数据最困难的挑战之一。”“计算速度和内存传输容量之间的差距越来越大,并且需要在远程存储介质上存储大量数据,这加剧了这种情况。”
处理大数据的关键挑战是在内存中存储数据的成本和规模。内存越快,成本越高,需要在计算元素之间移动的数据也越快。即使在最强大的超级计算平台上,也只能使用速度最快、容量相对较小的内存,因此系统工程师会依次添加更大、更慢、更远程的内存层,以容纳大型数据集的典型TB级和PB级数据。
“在这种敌对的环境中,我们的系统通过降低将数据移入和移出远程存储硬件的成本来工作,”Ltaief说。
Ltaief与同事David Keyes和Tariq Alturkestani一起开发了他们的多层缓冲系统(MLBS),通过协调存储层之间的数据移动来主动维护数据,并使其尽可能靠近计算硬件。
Alturkestani说:“MLBS依赖于多级缓冲技术,这使得它能够“看到”所有数百千兆字节的数据都在快速内存中,从而使模拟比智能更好。”缓冲机制可以防止应用程序在需要访问位于远程存储上的数据时停止运行,从而允许应用程序通过异步计算操作全速运行。"
有了MLBS提供的这种协同作用,KAUST的Shaheen-2超级计算机被用来模拟涉及数百千兆字节数据移动的三维地震勘探,加速度是2.5倍。
Ltaief表示:“这种方法还减少了将数据移入和移出远程存储介质所需的能量,这可能比在本地存储上执行单次计算所需的能量高数百倍。”“借助MLBS,我们可以降低数据移动的能源成本,这是我们中心的主要目标之一。”