台积电7nm制程、2.5D CoWoS封装,峰值算力147TFLOPS。编译 |  心缘编辑 |  漠影

芯东西3月31日报道,刚刚,国内首款自主可控的7nm云端通用GPU在上海正式发布。该芯片为上海初创公司天数智芯研发的旗舰7nm GPGPU云端训练芯片BI,其加速卡也一并以实体形式发布,即将进入批量生产和商用交付。天数智芯成立于2015年,于2018年正式启动BI的研发设计,该芯片在2020年5月流片、11月回片、12月成功“点亮”。据悉,BI芯片能以竞品50%的芯片面积、更低的功耗,提供主流厂商产品近2倍的峰值性能。



中国工程院院士倪光南,十二届全国人大外事委员会副主任委员、中国社科院“一带一路”国际智库专家委员会主席、蓝迪国际智库专家委员会主席赵白鸽博士,也在会上特别分享了关于科技自立自强的洞察。本文福利:推荐精品研报《GPU研究框架》,从GPU的底层技术、产业链发展情况和国产GPU的自主之路三方面全面解析GPU及其产业。可在公众号聊天栏回复关键词【芯东西109】获取。

01.240亿晶体管,峰值算力达147TFLOPS

天数智芯高级副总裁、首席科学家、联合创始人郑金山现场介绍了云端训练芯片BI及产品卡,BI芯片具备高性能、通用性、灵活性。作为天数智芯首款旗舰产品,BI采用台积电7nm FinFET工艺、2.5D CoWoS封装,基于全自研GPGPU架构,容纳240亿个晶体管,与主流GPGPU生态兼容,支持主流深度学习框架。



▲天数智芯BI产品参数

具体来看,该芯片内建FP32、FP16/BF16、INT32/16/8等多精度数据混合训练,FP16精度下其单芯峰值算力达147TFLOPS。目前,BI产品实测数据基本符合设计规划。天数智芯全自研GPGPU架构基于SIMT架构的可伸缩分层计算引擎,自主定义的丰富指令集支持标量、向量和张量操作,并支持GPU通用并行编程模型,能有效对接现有软件生态,易于扩展支持新的算法和应用领域,便于用户轻松迁移。



▲天数智芯BI架构

BI芯片还提供1.2TB/s HBM2内存带宽、32GB存储容量,片间互连带宽达64GB/s@16x PCIe4,支持虚拟化方式。其基于开放计算项目组(OCP)的标准加速模块组(OAM)支持单卡最大300W-450W的系统解决方案,配合OAM服务器,进一步提升数据处理整体性能。



▲天数智芯BI OAM产品卡

为了方便开发者使用,天数智芯还打造了兼容主流深度学习框架的软件栈,可帮助用户实现无痛迁移。同时,天数智芯软件栈结合硬件性能对HPC和区块链等应用提供细粒度的优化和更大的算力支持,包括能对接各种互联网应用平台的资源管理和监控插件、深度学习加速库、兼容多种语言的编译器、调优工具等。



▲天数智芯软件栈

在量产后,天数智芯BI芯片及产品卡能为AI训练及推理、认知型AI、高性能数据分析、基因组研究、金融预测分析等高负载工作提供算力支持,服务于教育、互联网、金融、自动驾驶、医疗、安防等各相关行业。

02.倪光南:网信领域“中国体系”不断发展壮大,但痛点依然存在

在致辞期间,天数智芯董事长蔡全根说道:“天数智芯的长远目标是,踏踏实实的在国产自主高端算力芯片上迭代攀登并最终比肩国际领先厂商。”“这个目标不易实现,但我们不会寻求模仿式的捷径和投机式的弯道超车。”蔡全根说。

▲天数智芯董事长蔡全根发表致辞演讲

中国工程院院士倪光南亦在现场发表演讲。他提到十八大以来,我国的信息产业实现了跨越式发展,目前在网信领域一些自主可控的核心技术已达到可用,并向好用、易用的方向发展,逐渐强大的网信领域的“中国体系”不断发展壮大。但短板和痛点仍然存在,比如CPU、GPU这两种信息系统中最复杂的电路芯片,越来越成为整个产业链上必须突破的短板。有利的是,我们已经在短板上逐渐积累了越来越丰富的人才和技术,我们可以利用自己的制度优势,集中力量办大事,充分利用“新基建”机遇,迅速取长补短。



▲中国工程院倪光南院士发表演讲

“天数智芯的BI芯片,一直坚持自主可控和开放创新并重,目前已拥有自己的技术体系和生态,性能也很好,得到了政府、众多投资者和合作伙伴的大力支持。”倪光南院士说,他期待天数智芯在行业逐步建立自己的标准,逐步发展壮大,可以和国际级企业同台竞争,为建设科技自立自强的科技强国做出贡献。

03.赵白鸽:必须保持自主研发和开放的平衡

赵白鸽博士是十二届全国人大外事委员会副主任委员、中国社科院“一带一路”国际智库专家委员会主席、蓝迪国际智库专家委员会主席。她提到很早就开始关注天数智芯,这也是蓝迪国际智库平台重点培育、推介的企业。在她看来,天数智芯BI的成功研发并推出实体产品,为我国自主高端主流通用芯片的开发应用,打开了一条突破口,也为国内算力密集行业的发展、人工智能的落地,提供了更多、更好的选择,也更多了一层安全保障。



▲赵白鸽博士发表致辞演讲

赵白鸽博士说,经过非常深入研究,他们发现必须做到知己知彼百战不殆,一定要竞争合作,美国在科技创新方面有非常好的基础,但中国在市场应用方面,没有其他地区可以比得过,我们必须寻找自身发展之路,同时认清新的发展机会。要继续发展,怎么做?赵白鸽博士认为,有些问题应该是政府解决,有些问题应该是企业。首先是国际形势带来的影响,我们必须认清我们是谁、我们往哪里走,以及他们是谁、他们往哪里走。我们必须保持自主研发和开放之间的平衡,以利于真正能获得世界领域的突破,把中国知识经济产业推动上去。同时赵白鸽博士提到,中国在底层技术方面(与美国)还有很大差距,美国笼络了全世界的人才,并有一定纠错能力,发现问题后会很快调整,扎实发展底层技术与战略、人才紧密联系。另外,政企间的沟通合作非常重要,管理创新非常值得研究,政绩不仅是GDP含量,还包括和知识经济紧密联系的GDP质量,包括对人才的支持和保护,我们必须以更开放的胸怀向全世界招揽人才。同时,我们也要注重知识产权保护,并将企业发展和国家大战略很好地结合。赵白鸽博士希望,天数智芯此次发布,也能引发对资源组合上的新思想和考虑。

▲天数智芯联合浪潮打造OAM AI服务器

04.过去一年,GPGPU创企成“吸金猛兽”

就在本月初,天数智芯宣布完成12亿元C轮融资,计划将资金用于进一步加速面向5G技术需求的云端训练及推理芯片的市场化、商业化和规模化。除了天数智芯外,国内多家聚焦云端芯片赛道的GPGPU创企在过去一年公布高额融资。为什么本土GPGPU创企开始在资本市场吃香?这是时代使然。随着人工智能技术从高校走向产业,擅长通用并行计算的GPGPU需求猛增,国际GPU巨头NVIDIA一手掌握绝大部分云端AI训练芯片市场,几乎全球没有能与之抗衡的对手。这一方面致使产业下游缺乏议价能力,另一方面也导致安全隐忧,在国际贸易纷争不休的背景下,芯片半导体产业关键环节的自主可控已迫在眉睫,多国均在谋划核心技术及供应链本土化。而国内市场容量和需求量持续上涨的GPGPU,无疑是必然要力争自主可控的技术高地。新基建大潮下,人工智能、云数据中心、城际交通、新能源汽车等行业的发展,以及5G应用的普及,正不断催化国内云端AI算力的需求。但之所以GPGPU市场长期被NVIDIA把控,主要原因在于其技术门槛高和生态布局完善,经历过先进制程研发和量产完整流程的人才非常稀缺。这是一个赢家通吃的领域,掌握充沛人才和市场资源的NVIDIA,通过CUDA不断积累和吸引开发者,从而构成愈发坚不可摧的生态壁垒。因此,选择GPGPU赛道的多数创企,在迈出第一步时都相当谨慎,虽然以NVIDIA为目标,但主要先聚焦在悠哈某一特定方向的性能,打出差异化优势,然后再逐步扩展产品边界。同时,考虑到绝大多数开发者都习惯使用NVIDIA CUDA,这些企业一方面着力研发方便好用的自家软件工具链,另一方面也基本都兼容主流GPGPU生态。

05.结语:国内GPGPU商用前路仍充满挑战

如今国内GPGPU玩家正群雄四起,包括天数智芯在内的多家创企,均在融资及产品商用落地方面持续发力。随着更多玩家的芯片从研发走向落地,国内GPGPU创企将从资本、人才的竞争,逐渐过渡到产品比拼和市场争夺的新较量环节。本土自研芯片的道路往往艰辛而充满风险。对于这些初创团队来说,除了研发出能令客户满意的芯片产品外,如何在巨头主导的市场中找到生存空间、如何构建起自己的生态……都是在未来商用化道路上需要克服的挑战。本文福利:推荐精品研报《GPU研究框架》,从GPU的底层技术、产业链发展情况和国产GPU的自主之路三方面全面解析GPU及其产业。可在公众号聊天栏回复