从揭示病毒分子结构到天气预报,高性能计算成科学家手中利器。作者 |  温淑


2020年12月末,国务院联防联控机制发布消息称,国药集团中国生物的新冠疫苗已获国家药监局批准附条件上市,未来将为全民免费提供。而这距离科学家首次解析出新冠病毒的分子结构的消息,仅仅相距约3个月。

去年9月份,清华大学李赛团队与浙江大学李兰娟团队合作解析出新冠病毒全病毒三维结构,这是在世界范围内,人类首次看清该病毒的内部结构。这一成果对疫苗及抗体研发、疫情防控有重要意义。此前,人类掌握的仅有新冠病毒的低分辩率照片,或是其部分重组蛋白的结构。



▲李赛教授团队对新冠病毒分子的研究论文已发表于知名期刊Cell,题为《SARS-CoV-2病毒的分子结构》

2020是艰难的一年,新冠疫情全球蔓延,在造成全球公共卫生危机的同时,为千行百业的发展按下“暂停键”。

但同时,2020也是充满希望的年份,我们看到,疫情之下,科学研究成为破局的一把“利刃”。

利用超算寻找疫苗药物分子、基因测序溯源新冠病毒、眼底相机检测技术辅助识别特定疾病……种种先进技术以加速度实现落地应用,为现实生活保驾护航。

在这背后,科研人员面临怎样的挑战?是怎样默默无闻付出努力?今天智东西与你一起,走进这一年里,那些于无声间守护你我的黑科技。

01.数据量动辄高达100TB,高性能计算促科研发展

新冠疫情从2020年初肆虐至今,一年有余的时间里,人类利用高性能计算解决方案抗击疫情的尝试从未停止。但是,无论是新冠药物研发与验证还是基因病毒测序,均对计算平台的性能提出了较高的要求。

举例来说,在对新冠病毒分子结构的研究中,清华大学团队在二级实验室提纯浓缩病毒后,共采集到多达100TB的数据。抗疫如救火,如何在短时间内完成对这100TB数据的处理和分析,成为科研团队面临的重要命题。最终李赛团队运用NVIDIA DGX-1人工智能超级计算机加速了对100TB高质量冷冻电镜断层图像数据的高强度分析,绘制出2300颗新冠病毒的高分辨率三维构像。

其实,不仅仅在抗击新冠疫情上,在天气预报、保护野生动物、量子计算、天体物理学等诸多领域,科研人员常常面临TB级、乃至PB级数据量带来的考验。

比如,要搭建天气预报的气象模型,科研人员需要考虑气象雷达系统、卫星、飞机、气象气球、气压计、地面温度计等多种来源提供的数据流。IBM曾与美国国家大气研究中心(NCAR)共同搭建一个名为“GRAF”的高性能计算大气预报系统,该系统每半秒就需对分布在全球范围的约15亿个点进行一次监测。运行结果显示,基于其搭载的296个GPU所提供的计算性能,“GRAF”能够以每小时一次的频率向全球40%的地区预报天气情况,而且预报范围可缩小至2英里。

02.NVIDIA软硬一体的产品生态:为700多种HPC应用加速


至今,加速计算为众多行业带来巨变,已有700多个应用针对GPU进行了优化。面向科学计算的广泛需求,行业领导者NVIDIA提供了覆盖硬件、软件、框架的完整生态。

NVIDIA专为GPU上的通用计算开发了并行计算平台和编程模型CUDA,并提供CUDA工具包。

借助CUDA,开发者能够利用NVIDIA各系列GPU的强大性能,显著加速计算应用。NVIDIA提供的CUDA工具包中包含多个GPU加速库、多种调试和优化工具、一个编译器以及CUDA运行环境。

面向科研领域的高性能计算需求,NVIDIA提供全套综合套件NVIDIA HPC SDK。这也是目前唯一可用于编程加速计算系统的全套集成SDK。

NVIDIA HPC SDK包含编译器、库和软件工具。HPC开发者可通过它来编程从GPU到CPU、整体互联的HPC平台。

NVIDIA HPC SDK C++和Fortran编译器是首批同时也是目前唯一支持C++ 17并行算法和Fortran内联函数等标准语言结构自动GPU加速的编译器。



▲NVIDIA HPC SDK

硬件方面,NVIDIA提供一系列GPU,以及基于GPU的超级计算机、工作站等产品,满足不同类型科研应用的算力需求。

NVIDIA产品组合对科学研究的加速作用已在许多项目组得到验证。比如,在一项新冠病毒基因组测序研究中,研究团队利用NVIDIA端到端基因组测序分析解决方案NVIDIA Clara Parabricks进行基因组测序。

结果显示,相比现有的基于最先进CPU的解决方案,GPU提供了超过33倍的性能改进,并且结果一致性超过99.9%。

不仅如此,针对科研应用落地难问题,NVIDIA于2020年专门推出应用研究加速器计划(Applied Research Accelerator Program),对于借助NVIDIA平台进行GPU加速应用部署的研究,NVIDIA将提供技术指导、硬件捐赠、资金、资助申请帮助以及 AI 训练计划等方面的支持。

03.GPU——科学计算的效率“倍增器”


目前,NVIDIA最新的NVIDIA A100 GPU,基于NVIDIA安培架构和7nm制程工艺,包含超过540亿个晶体管。

A100的双精度Tensor Core将GPU双精度计算技术提升至全新高度。借助HBM2e技术提供的每秒超过2TB的带宽和大容量内存,科研人员还可以利用A100,将原本需花费10小时的双精度模拟过程时长缩短到4小时之内。另外,安培架构内置TF32,可将单精度、密集矩阵乘法运算的吞吐量提升高达10倍。



▲NVIDIA A100 80GB GPU


不论是在人们致力于使用科学的力量打赢抗疫之战的过程中,还是在材料分析等其他领域,可以看到,GPU产品正成为加速提升科研效率与质量的有力工具。

早在疫情之前,科研人员就曾尝试用GPU助力分析打结蛋白质的折叠过程。疫情中,上海交通大学魏冬青教授团队,利用5台NVIDIA DGX-2人工智能超级计算机进行抗病毒药物研究,并将模拟计算所需的时间从1到2个月,缩短至1到2天。

在为科研项目提供效率和质量保障以外,GPU亦可降低各领域科研人员进行科学计算的“门槛”,使研究团队可以随时随地处理日常工作。

比如,NVIDIA推出的DGX Station A100工作组服务器,在提供高达2.5 petaFLOPS的算力、高达320GB的超大内存的同时,还能满足多用户使用需求。



▲DGX Station A100工作组服务器

04.结语:抗疫这一年,致敬科学家

在材料模拟、智能医疗、气象学等各个科研领域中,呈现指数级别增长的数据量和计算复杂度,均对高性能计算解决方案提出更高要求。

不仅如此,从2008年初谷歌推出流感趋势(GFT)网站,并于2009年成功预测到H1N1在全美范围的传播后,大数据科学在公共卫生领域的巨大潜力逐步显现。在抗击新冠疫情的过程中,先进的计算平台更被寄予厚望。

疫情紧迫、各领域科研计算量和复杂度飙升,面临这些挑战,科研工作者怎样破局?

工欲善其事,必先利其器。对于各个领域内的科学计算任务,加速计算平台将成为研究者提升科研质量和效率的得力工具。相应地,科学技术承担了推动社会发展和战胜严峻挑战的关键作用。

现代科学研究需要能够处理大型计算工作负载的基础架构,才能从海量数据中获取快速精准的洞见。通过高性能计算(HPC) 和AI的融合,不仅能拓展科学研究的范围,还可加速科学创新的步伐。科学家借助AI与HPC可利用实验数据与模拟数据对世界进行建模,进而攻克过去无法解决的难题。

点击“阅读原文”,NVIDIA为研究人员提供了全面的最新研究资源,从700多款GPU加速的科学计算应用、NVIDIA HPC SDK再到能够简化DL、ML和HPC工作流程的GPU优化型软件中心NVIDIA NGC(NVIDIA GPU Cloud),您还将了解到高校科研最新案例以及更多教育优惠和资源。