中国科大研究团队荣获IEEE Cluster 2024最佳论文奖

开云手机登录入口,开云(中国):2024-09-30浏览次数:10

       2024年9月24日至27日,2024年度IEEE国际集群计算会议(IEEE International Conference on Cluster Computing,IEEE Cluster)在日本神户召开。我校计算机科学与技术学院孙广中教授团队发表的论文“Siesta: Synthesizing Proxy Applications for MPI Programs”获唯一最佳论文奖(Best Paper Award)。

       基于消息传递接口(Message Passing Interface,MPI)的并行程序是目前超级计算机上运行的主要程序类型。在评测超级计算机性能时,由于科学、工程领域中实际使用的MPI程序具有高度的复杂性、专业性,难以简便快捷地部署、运行和测量,因此常常使用代理程序(Proxy application)来代替。代理程序是真实MPI程序的简化版本,代码量小、库依赖关系少、仅保留部分关键功能,在性能表现上与真实MPI程序具有相似的特征。

       尽管是简化版本的程序,代理程序仍然高度依赖于科学、工程领域专家与并行计算专家的协作开发,需要额外的人力和时间成本,因此通常只能覆盖最重要的少量MPI程序,无法满足广泛的定制化需求。同时,对于保密或者商业软件,其源代码也无法提供给专家来设计代理程序。针对这些问题,论文提出了一种自动合成代理程序的方法。对于任意给定的无源代码的MPI程序,通过追踪MPI程序的计算、访存、通信等事件,获取其行为序列和性能指标的记录(称之为trace)。基于文法分析,对trace中隐含的程序行为模式给出一种推测和压缩表示,并将这一表示转换为可编译执行的代码片段组合,作为给定MPI程序的代理程序。整个处理流程中无需了解给定MPI程序的领域知识,可以完全基于脚本和工具软件自动化地进行,有效减少代理程序开发的人力和时间成本,提升代理程序的应用覆盖范围和更新频率,在高性能计算领域中具有广泛的应用前景。


       自1999年创办以来,IEEE Cluster已经成为分布式与并行计算领域非常重要的国际会议,是中国计算机学会(CCF)推荐的B类国际学术会议。大会在分布式系统、高性能计算、体系结构方面对学术界和产业界均有广泛的影响力。

       论文通讯作者为孙经纬特任副研究员,第一作者是计算机科学与技术学院2023级博士生罗极羽,第二作者和第三作者分别为闫韬(2023届硕士)和徐庆国(2024届硕士)。三位研究生由孙广中教授和孙经纬特任副研究员共同指导。该研究工作历时2年,得到了国家自然科学基金青年项目、中国科学技术大学理实工程的资助,实验平台得到了中国科学技术大学超级计算中心支持。