高性能计算检查点技术发展与应用

刘 婵娟(广州商学院,中国)
姜 微(广州商学院,中国)
王 欢(广州商学院,中国)

DOI: http://dx.doi.org/10.12349/iser.v6i10.7896

Article ID: 7896

摘要


在应用规模不断扩大的今天,高性能计算的复杂程度也在不断提升,为了确保其容错性能满足实际需要,应进行检查点技术的运用。基于此,文章以高性能计算检查点技术作为切入点,简要论述高性能计算检查点技术的发展,并对高性能计算检查点技术的应用进行分析,主要包括并行计算容错、深度学习容错、HPC的调度和迁移以及FPGA的调试,旨在为高性能计算检查点技术的未来发展与应用提供参考。

关键词


检查点技术;HPC系统;GPU集群;FPGA

全文:

PDF

参考


刘扬,许建飞,许黄超,吴璨,胡泰源,原惠峰,高凌云,梁文昊,董盛,马英晋,李瑞琳,赵永华.基于超级计算机的高性能计算应用发展现状及趋势研究[J].数据与计算发展前沿(中英文),2025,7(2):68-85.

杨敏,何芸,许涛,景少军.高性能GPU计算集群应用体系建设[J].信息系统工程,2025(3):102-105.

郑宏兴.“高性能计算在电波传播研究中的应用”专题前言[J].电波科学学报,2025,40(3):405-405.

陈筱琳,张亚强,史宏志.面向多样计算场景的检查点技术综述[J].计算机应用,2025,45(6):1922-1933.

陈轶阳,王小宁,闫晓婷,李冠龙,赵一宁,卢莎莎,肖海力.基于CRIU的高性能计算容器检查点技术研究[J].计算机科学,2024, 51(9):40-50.


Refbacks

  • 当前没有refback。


版权所有(c)2025 刘 婵娟, 姜 微, 王 欢

Creative Commons License
此作品已接受知识共享署名-非商业性使用 4.0国际许可协议的许可。