DepGraph Supernode是由武汉华中科技大学的研究生发起的一个“培训项目”,仅拥有128个核。但根据国际超级计算大会本月初发布的年度Graph500排名,DepGraph在解决单源最短路径(SSSP)问题方面的速度几乎是Fugaku的两倍。SSSP是一个影响人工智能在广泛领域性能的难题。
参与该项目的一年级研究生说:“感觉就像做梦一样。”据悉,该团队的平均年龄为24岁。
数学家经常用图表来描述关系。最简单的图形只能包含两个点,点与点之间有一条线。更复杂的图表已应用于许多领域,例如拥有大量上市公司的金融市场、全球社交媒体平台或游戏中。而人工智能可以检测其中隐藏的关系,或者在复杂、不断变化的图形中发现进化模式。
但是训练和学习的过程通常涉及大量的计算。即使是一些看似简单的任务,比如寻找两点之间的最短路径,对计算机来说也是一个巨大的挑战。武汉研究小组表示,他们发现了一个制约问题,可能会严重影响计算机从事这类工作。
根据该团队去年提交给IEEE高性能计算机架构研讨会的一篇论文,一台超级计算机可以使用许多CPU核心同时执行许多计算任务,但是在处理与图相关的问题时,一个核中的计算过程往往取决于另一个核的结果。该论文称,这种依赖性破坏了计算过程。大多数时候,核心要么等待,要么用另一个核的新结果重新计算。
该团队表示,DepGraph机器通过一种新的结构和软件解决了这个问题,通过减少依赖造成的混乱,可以将每个核心的性能提高到极限。该项目组的顾问、计算机副教授表示:“不要低估学生的能力,在图形计算中,单台计算机第一次击败了一组计算机。”
这些学生的导师金教授表示,这些年轻的研究人员曾与中国的高科技公司密切合作,他们最大的灵感来自于这个行业。他说:“这个问题肯定源于行业,这项研究满足了我们国家最迫切的需求。”
该团队的负责人赵博士表示,他们每两周向华为技术有限公司报告一次研究进展。“硕士和博士生可以接触到国家重点研发计划的课题,这立即打开了我们的视野,并将我们与行业更紧密地结合在一起。”但是他表示,他们也享有高度的自由。“我们自己找到了研究课题。导师不会告诉学生该做什么,而是支持我们朝着自己感兴趣的方向前进,这非常刺激。”
十大最强大的超级计算机/来源:图示
根据 Graph500,Fugaku在广度优先搜索 (BFS) 中表现最佳,这是另一个主要的图问题,其算法更简单但需要更多的原始计算资源来解决。2015年建成的中国超级计算机神威太湖之光在该类别中排名第二,DepGraph在巨型计算机中排名第九。
据悉,我国已经建造了一些世界上最大的计算机,包括一些可以与美国能源部的“Frontier”计算机相匹敌的百亿亿次计算机(Frontier是目前公开记录中最快的计算机)。到目前为止,我国的研究人员在这些新机器上进行了前所未有的实验,例如世界上最大规模的人工智能训练。