本文来自微信公众号:新智元 (ID:AI_era),作者:桃子、拉燕,原文标题:《世界首颗3D芯片诞生!集成600亿晶体管,突破7nm制程极限》,头图来自:Graphcore


全球首颗3D封装芯片诞生!


周四,总部位于英国的AI芯片公司Graphcore发布了一款IPU产品Bow,采用的是台积电7纳米的3D封装技术。


据介绍,这款处理器将计算机训练神经网络的速度提升40%,同时能耗比提升了16%。



一、600亿晶体管,首颗3D芯片诞生


能够有如此大的提升,也是得益于台积电的3D WoW硅晶圆堆叠技术,从而实现了性能和能耗比的全面提升。


正如刚刚所提到的,与Graphcore的上一代相比,Bow IPU可以训练关键的神经网络,速度约为40%,同时,效率也提升了16%。



同时,在台积电技术加持下,Bow IPU单个封装中的晶体管数量也达到了前所未有的新高度,拥有超过600亿个晶体管


官方介绍称,Bow IPU的变化是这颗芯片采用3D封装,晶体管的规模有所增加,算力和吞吐量均得到提升,Bow每秒可以执行350万亿flop的混合精度AI运算,是上代的1.4倍,吞吐量从47.5TB提高到了65TB。


Knowles将其称为当今世界上性能最高的AI处理器,确实当之无愧。 



Bow IPU的诞生证明了芯片性能的提升并不一定要提升工艺,也可以升级封装技术,向先进封装转移。


Graphcore 首席技术官和联合创始人Simon Knowles表示,“我们正在进入一个先进封装的时代。在这个时代,多个硅芯片将被封装在一起,以弥补在不断放缓的摩尔定律(Moore’s Law)道路上取得的不断进步所带来的性能优势。”



二、台积电WoW封装技术


2018年4月,在美国加州圣克拉拉举行了第二十四届年度技术研讨会。在这次会上,全球最大的半导体代工企业台积电首次对外公布了名叫SoIC(System on Integrated Chips)的芯片3D封装技术。



这是一种整合芯片的封装技术,由台积电和谷歌等公司共同测试开发。而谷歌也将成为台积电3D封装芯片的第一批客户。


什么是封装技术呢?


封装技术的主要功能是完成电源分配、信号分配、散热和保护等任务。而随着芯片技术的不断发展,推动着封装技术也在不断革新。


而3D封装技术,简单来说,就是指在不改变封装体尺寸的前提下,在同一个封装体内,在垂直方向上叠放两个或者更多芯片的技术


相较于传统的封装技术,3D封装缩小了尺寸、减轻了质量,还能以更快的速度运转。


台积电在年度技术研讨会上表示,SoIC是一种创新的多芯片堆叠技术,是一种晶圆对晶圆的键合技术。SoIC的实现,是基于台积电已有的晶圆基底芯片(CoWoS)封装技术和多晶圆堆叠(WoW)封装技术所开发的新一代封装技术。


晶圆基底芯片(CoWoS),全称叫Chip-on-Wafer-on-Substrate,是一种将芯片、基底都封装在一起的技术。封装在晶圆层级上进行。这项技术属于2.5D封装技术。



而多晶圆堆叠技术,或者堆叠晶圆(WoW,Wafer on Wafer),简单来说,就是取代此前在晶圆上水平放置工作单元的技术,改为垂直放置两个或以上的工作单元。这种做法可以使得在相同的面积下,有更多的工作单元被放到晶圆之中。



这样做还有另一个好处:每个晶片可以以极高的速度和最小的延迟相互通信。甚至,制造商还可以用多晶圆堆叠的方式将两个GPU放在一张卡上。


但也存在问题。晶圆被粘合在一起后,一荣俱荣、一损俱损。哪怕只有一个坏了,另一个没坏,也只能把两个都丢弃掉。因此,晶圆量产或成最大问题。


而为了降低成本,台积电只在具有高成品率的生产节点使用这项技术,比如,台积电的16nm工艺。


相较于CoWoS和WoW,SoIC更倚重CoW(Chip on Wafer)设计。对于芯片业者来说,采用CoW设计的芯片,生产上会更加成熟,良率也可以提升。



值得一提的是,SoIC能对小于等于10nm的制作过程进行晶圆级的键合。键合技术无疑会大大提高台积电在这方面的竞争力。


三、性能表现怎么样?


Bow是IPU-POD人工智能计算系统的核心,称为 BOW PODs。


它可以从16个BOW芯片扩展到1024个,提供高达358.4千亿次的计算机运算速度,同时配合多达64个CPU处理器。



新的Bow-2000 IPU Machine是Bow Pod系统的构建块。


它是基于与第二代IPU-M2000 machine同样鲁棒的系统架构,但是配备了四个强大的Bow IPU处理器,可提供1.4 PetaFLOPS的人工智能计算。



这么厉害的芯片,还不赶快拿来练练手?


近年来,语言模型的参数量不断刷新。从惊艳四座的谷歌BERT,到OpenAI的GPT-3,再到微软英伟达推出的威震天等等,都对训练时所需的计算性能提出了更大要求。


根据Graphcore公布的初始数据可以看出,这些模型在最新的硬件形态上都有很大的性能提升


MLPerf v1.1训练结果<br label=图片备注 class=text-img-note>
MLPerf v1.1训练结果


另外,在图像方面,无论是典型的CNN网络,还是近期比较热门的Vision Transformer网络,以及深层次的文本到图片的网络。


与上一代产品相比,Bow IPU都有30%到40%的性能提升。


对于最先进的计算机视觉模型EfficientNet,Bow Pod16能够提供可比Nvidia DGX A100系统5倍以上的性能,而价格只有它的一半,总体拥有成本优势提升高达10倍。



四、下一步,超级智能AI计算机


Graphcore今天还宣布了一件重大的事,正在开发一款超级智能AI计算机,要在2024年推出,售价1.2亿美元。


我们知道,大脑是一个极其复杂的计算设备,在一个生物神经网络系统中拥有大约1000亿个神经元和超过100万亿个参数,它提供的计算水平是任何芯片计算机都无法比拟的。


而这款超级智能AI计算机Good将超越人类大脑的参数能力。



Good计算机名字何来?是以计算机科学先驱 i.j. Jack Good 的名字命名。


Jack Good在1965年的论文《关于第一台超级智能机器的推测》中就描述了一种超越我们大脑能力的机器。


未来,它可以进行超过10 Exa-Flops的人工智能浮点计算,最高可达4PB的存储,带宽超过10PB/秒。


Graphcore的首席执行官Graphcore表示,“当我们创建 Graphcore 的时候,我们脑海中一直有一个想法,那就是建造一台超智能计算机,它将超越人脑的能力,这就是我们现在正在努力做的事情。”


参考资料:

https://spectrum.ieee.org/graphcore-ai-processor

https://www.zdnet.com/article/ai-computer-maker-graphcore-unveils-3-d-chip-promises-500-trillion-parameter-ultra-intelligence-machine/

https://www.hpcwire.com/2022/03/03/graphcore-launches-wafer-on-wafer-bow-ipu/


本文来自微信公众号:新智元 (ID:AI_era),作者:桃子、拉燕