在4000多位合作伙伴、权威媒体、专家学者、主管部门领导的见证下,新一代通用处理器龙芯3A6000、打印机主控芯片龙芯2P0500重磅发布,众多围绕龙芯3A6000的整机产品登场亮相,龙芯处理器核IP、龙芯自主指令系统架构授权计划公布。
多年后如果回望半导体国产化之路,这无疑是一个关键的时刻。
极具革命色彩的开幕式
“龙芯之母”黄令仪院士今年4月离开了我们,大屏幕上打出的她的豪言壮语令人动容
一、龙芯3A6000:硬件性能飞跃、终于基本完成
龙芯中科董事长胡伟武发表主题演讲《将自主进行到底》,而大会主题“到中流击水”,代表龙芯走到了一个关键的时刻,正在经历第二次转型,从政策性市场为主转向开放性市场为主。
龙芯3A6000处理器由龙芯中科基于自主的LoongArch龙架构指令集,完全自主设计,有着优异的性能表现,堪称我国自主桌面处理器设计的又一个里程碑。
龙芯3A6000龙芯第四代微架构LA64的首款产品,采用自主成熟工艺制造,4个物理核心,支持同时多线程技术(SMT2),因此有8个逻辑核心,主频为2.5GHz。
内存还是双通道DDR4-3200,而在安全方面集成可信模块,支持安全启动方案和SM2、SM3、SM4国密算法。
龙芯微架构已经演进了四代,第一代GS464曾用于龙芯3A1000、龙芯3B1500,第二代GS464E曾用于龙芯3A2000、龙芯3A3000,第三代GS464V/LA464曾用于龙芯3A4000、龙芯3A5000。
可以看到,每代微架构都对应两代产品,整体采用架构、工艺交替升级的策略,十分类似Intel当年的Tick-Tock策略。
第四代微架构LA664全面提升了各项指标,尤其是首次将4发射提升到6发射,同时在ROB、定点/向量物理寄存器、发射队列、功能部件、载入/存储队列等各项指标上,都实现了50%到100%的提升,幅度相当之大。
这一代架构上,龙芯终于突破了同时多线程技术,追上了Intel、AMD,而且从官方数据还是实测看效率也是相当高的。
性能方面大家见过不少数据了。根据中国电子技术标准化研究院赛西实验室的测试结果,龙芯3A6000 SPEC CPU 2006、SPEC CPU 2017、Stream、Unixbench各项测试的成绩都非常突出,无论单核性能还是多核性能,无论整数性能还是浮点性能,都实现了大幅度的跨越,甚至远远超过Intel、AMD几代产品的提升。
综合相关测试结果,龙芯3A6000处理器总体性能与Intel 2020年上市的第10代酷睿i3-10100四核处理器基本相当。
要知道,现在很多用户还是八九代酷睿的配置。
胡伟武强调,经过多年的“补课”,龙芯3A6000终于基本完成了这一任务,与当今主流处理器的差距已经基本全部补齐。
要知道,2002年的龙芯一号,和当时主流的奔腾4差距有20多倍。
2021年的龙芯3A5000已经将这一差距缩小到不到1倍,相当于第三代酷睿i3四核心,而仅仅两年后,我们就几乎完全追了上来!
龙芯3A6000还只是全新微架构的第一站,未来一两年我们还将看到面向服务器的龙芯3C6000、龙芯3D6000、龙芯3E6000,分别支持16核心32线程、32核心64线程、64核心128线程,大大缩小和世界领先产品的差距,无论单核性能还是多核性能。
针对移动终端,下一步将是龙芯2K3000,微架构有所不同采用LA364,当然也是自主的LoongArch龙架构指令集,最多8核心8线程。
龙芯3C6000目前已经完成设计,单芯片放入16个核心,内存支持四通道DDR4-3200,扩展连接支持64条PCIe 4.0,实现成倍乃至数量级的提升。
虽然和世界最先进的十二通道DDR5、128条PCIe 5.0还有一代的差距,但也并非不可逾越的鸿沟。
再通过龙链技术(Loongson Coherent Link),将两颗、四颗龙芯3C6000整合在一起,就可以得到龙芯3D6000、龙芯3E6000。
这是一项支撑Chiplet晶粒设计的关键技术,可以对标Intel CXL、NVIDIA NVLink、AMD Infinity Fabric等先进互连技术,相比于传统PCIe总线可以大大提高效率、降低延迟。
同时,龙链技术支持高速缓存一致性协议传输,可以保证CPU与GPU、CPU与GPGPU、GPGPU与GPGPU之间高速、稳定互相连接,完全扩展开来。
最关键的是,这一切都基于龙芯全自研的物理接口,无论标准性、性能和效率,还是扩展性、升级性都可以自主掌握。
针对笔记本、云终端的新一代龙芯2K3000,目前已经完成前端设计,后续还有不少工作要做,包括内核、后端、外围等等。
它最多可以做到8核心,单核性能可媲美上代桌面级的龙芯3A6000,集成自研密码模块,支持PCIe 4.0、SATA 3、USB 3、HDMI等丰富的扩展和输入输出。
很关键的一点,它会集成新一代自研的LG200 GPGPU核心,不但能用来做图形渲染,还能做到计算加速、AI加速,是一个统一高效的新架构。
作为龙芯自研的第二代图形核心,LG200已经突破了GPGPU的关键技术,图形渲染支持OpenGL 4.0,通用计算支持OpenCL 3.0,AI加速支持INT8整数张量加速。
它还支持多节点互连,结合龙链技术,未来会有同样架构的专用独立GPGPU芯片!
在路线图上,服务器级的龙芯3D7000、龙芯3E7000,桌面级的龙芯3B6000、龙心3B7000也都安排上了,它们都会是LA664微架构的升级版本。