北京时间2023年7月15日,SOSP 2023公布了论文入选结果,我实验室与AWS Shanghai AI Lab、南方科技大学联合完成的论文“gSampler: General and Efficient GPU-based Graph Sampling for Graph Learning”成功入选 SOSP 2023 会议!本届会议共收到229篇投稿,最终接受43篇,录用率18.8%。向各位参与研究工作的老师、同学、合作者表示祝贺!
论文简介:
图神经网络(Graph Neural Network, GNN)被越来越广泛应用信息检测、电商推荐、知识图谱等各种领域。为了支持大规模的图学习任务,现有的GNN训练往往采用图采样的方式进行。但是,由于图采样算法的多样性和复杂度不断增加,图采样往往成为GNN训练的主要瓶颈;此外,现有的采用框架在表达图采样算法时通用性和执行效率也存在不足。
为了弥补这一差距,我们对15种常用的图采样算法进行了全面研究,提出了一个通用而高效的GPU图采样框架gSampler。gSampler基于matrix-based的抽象,使用4步骤Extract-Compute-Select-Finalize(ECSF)模式来支持各种图采样操作,可以轻松表达复杂的图采样算法。gSampler应用代码的中间表达(IR)并结合相关优化,将高级API代码转化为高效的GPU执行代码。在gSampler加速下,现有的GNN框架可有效减少训练时间达40%以上。
该项工作是由我实验室在读博士生龚平、李诚副教授,AWS Shanghai AI Lab的王敏捷老师、蔡振坤老师,以及南方科技大学在读研究生刘仁杰、在读研究生毛尊尧、晏潇老师、李卓钊老师联合完成。