最近有一个话题很有热,英伟达显卡这么先进,为什么我国不拆开英伟达显卡研究,从而造出自己的国产显卡?显卡是游戏的衍生物,在数字时代的浪潮中,游戏在过去被认为是娱乐的代名词,但没想到它成了科技创新的强大推手,游戏的发展在国内市场一直面临一些市场认知的问题与阻力,这是导致国产显卡落后的一个因素。
游戏是英伟达成功的关键,自1993年成立以来,游戏显卡是英伟达最核心的产品,发展到今天,已占据全球80%的市场,在过去,市场上那些对画面、制作质量要求非常高的游戏玩家,不断逼迫英伟达去开发性能更高的显卡,推动英伟达成为GPU领域的头号玩家。
在近20多年以来,英伟达研发投入一直在增长,研发支出几乎保持在20%~30%之间,远超美国科技企业3%的平均值。在游戏行业的拉动下,英伟达的GPU芯片性能高歌猛进。正是在游戏显卡领域积累的GPU底层能力,让英伟达赶上了AI的时代列车,为大量厂商提供顶级的GPU芯片。
发展到今天,英伟达目前在显卡市场的断层领先,背后已持续投入了几十年的研发资金和人力资源,背后积累的经验和技术是非常难以复制的,形成了很高的技术壁垒。英伟达芯片内部的复杂度已经不是靠逆向可以研究出来的地步了。
这种复制的想法,其实在早期有成功的可能性,早期处理器工艺还没那么复杂、还没那么先进的时候。比如英特尔的4004、8086等早期处理器,拆下来显微镜就能看清楚是怎么设计的结构,基本的门电路差不多都能认出来,而且由于功能简单,认不出来的也都可以补出来,因此这个时代是可以复制的。
但是现在的英伟达的CPU、GPU设计都动辄集成百亿、几百亿晶体管,结构复杂无比,不可能通过拆解认出来怎么设计的,只能通过X光透射大概了解其区域分区。至于复制,只能是天方夜谭了。
英伟达目前被制裁的A100 GPU,采用TSMC 4N工艺也就是5nm工艺制造,大约800平方毫米。
在5nm等级的工艺上,就算使用0.1nm波长的X光机,去扫描内部结构,得到大约540亿晶体管的内部图,但是由于芯片内部是3D立体的,存在多个层级,因此单纯的2D图像是无法还原内部结构的。它几乎在800平方毫米的地方集成了540亿的晶体管,在某些模块上还存在别人的特殊设计和特殊工艺。
肉眼肯定是无法看出这座城市的细节,必须借助显微镜才行。哈工大的顶级显微镜,有60nm的分辨率,但是英伟达的GPU核心可是用5nm或8nm工艺制作的。当然,我们用最先进的透射电子显微镜(TEM)足以观察到物理尺度为4nm的H100显卡中的晶体管,但问题来了,如何确定这540亿个晶体管各自的类型、精确的位置,以及晶体管之间的走线?
此外,英伟达设计出来之后,需要向芯片制造企业台积电提供芯片的GDS版图,根据GDS版图,在晶圆上经过光刻、刻蚀、离子注入、沉积、金属化等几十个步骤才可以制造出相应的芯片。
事实上,类似的问题,在发动机、光刻机等问题上曾经也有过类似的发问。难度还在于,这其中的工艺、材料、设备、技术等供应链来自于几十个国家。
况且英伟达的产品是硬件与软件的高度结合,在图形显示方面,GPU的图形驱动的好坏直接影响用户体验;在通用计算方面,CUDA及其各类高性能计算库提供了完备的支持,目前英伟达在软件上最大的护城河是CUDA,英伟达在CUDA方面下了极大的努力,而且这件事做了很多年,到今天CUDA可以影响很多领域,今天连OpenCL、Metal都没法撼动CUDA的地位,更别说去从0到1做生态了。
没办法拆开英伟达的显卡研究,给我们的反思
没办法拆开英伟达的显卡研究,造出自己的国产显卡,留给我们的教训与反思是,技术没有好坏之分,国内科技企业的技术研发更倾向去嗅风向,衡量当下的前景与投入产出,过去认为显卡仅仅用在游戏领域,大量投入不值得,缺乏商业前景,而游戏也面临各种风险。但显卡的应用并不局限于游戏,发展到后来,它为英伟达在GPU领域的领先打下了基础,进而成为AI时代卖铲子的人。
其次,一项技术的研发与推进,要从市场初期就瞄准风向,扎扎实实的推进,很多前瞻性的技术从最初时不起眼,在前期技术壁垒尚未形成的阶段,尚可追赶,越到后期,难度越来越大。
因此对于任何科技的探索,不应该用当下的局限去推测技术的应用前景,进而判断是否值得投入,如果在初期,国内厂商不局限游戏的未来去判断显卡的未来,那么国内显卡技术会不会有另一种发展的可能?而在技术没有大幅拉开差距的情况下,这种造出自己的国产显卡的可能性就越来越高,一旦技术积累拉开差距,这背后的产业链差距与软硬件生态差距、商业应用场景差距都被一并拉开。
其三,当然,这背后也与国内科技企业领域过去很长时间的造不如买的思维,耽误了前期追赶、弥补差距的时间窗口,伴随着一项科技产品的性能越来越强,晶体管越来越复杂,工艺越来越看不懂,那么砸钱也无济于事了,钱不能解决的事情,才是大事,老美限制英伟达显卡的销售,其实就是限制中国对先进生产力的探索。
不过,在深度全球化的时代,英伟达也无法脱离中国产业链,中国是少数的同时拥有从芯片研发到生产制造,再到应用场景的,具备全产业链能力的国家,而英伟达的芯片中也有大量零部件产自中国,尤其是显卡算力越高,就越是依赖光模块这条技术路径。因为GPU运行,涉及大量数据传输和计算,光模块的作用就是,进行光、电信号转换。
为了满足AI大模型、科学计算等算力需求,每台服务器动辄需要数百甚至数千个GPU。2010年,全球10大光模块企业名单,中国只入围了一家。到了2022年,全球前10,中国就占了7个。
人们总期望弯道超车,但弯道超车需要长时期的投入与积累,国产显卡的路还有很长,而且发展GPU的难度可能会比CPU还要大。中国新能源汽车的弯道超车,是经历了20年的布局,放到芯片产业上也是同理,令人欣慰的是,我们现在看到了自上而下的整体规划,从芯片制造,到设计,从系统软件的基础建设,到应用侧的布局,进行全面的独立自主的信息生态体系建设。我们需要有务实的心态去认识到真正的难题,才能对产业有真正的敬畏,才能有真正的反思与努力的方向,当下还任重道远,但我们依然保持期待。
作者:王新喜 TMT资深评论人