"); //-->
国产CPU六剑客,能否撑起中国CPU的一片天?
编辑 | 芯东西内参
中央处理器(CPU),顾名思义,是底层硬件基础设施中的核心。当前CPU主流芯片架构为Arm和x86,均为国外主导,国产化率较低。经过多年发展,国产CPU初步形成六大厂商齐头并进的格局,以鲲鹏、飞腾、龙芯、兆芯、海光、申威为代表,一批优质国产CPU企业快速崛起。其中,龙芯中科、海光信息在2022年先后登陆科创板,海光信息自上市后一直是科创板市值最高的芯片半导体公司。截至2023年1月16日收盘时间,海光信息总市值967亿元,龙芯中科总市值为352亿元。按指令集架构,国产CPU厂商采用的路线可分为四类:x86、Arm、MIPS、Alpha。
▲从指令集架构看CPU市场格局x86是当前PC及服务器市场的主流架构。海光信息、兆芯都采用x86架构IP内核授权模式,可基于公版CPU核进行优化或修改,优点是性能起点高、生态壁垒低,但由于依赖海外企业授权,自主可控风险偏高。相较x86,走Arm路线自主化程度更高。华为鲲鹏、飞腾都获得了Armv8永久授权,可自行研发设计CPU内核和芯片,也可以扩充指令集。不过Arm将不再向这些国产CPU厂商提供Armv9的永久授权,因此采用Arm架构仍存长期隐患。龙芯中科、申威分别走的是MIPS、Alpha路线,自主可控程度相对更高,但偏小众。此外,与Arm、MIPS同源的RISC-V也正在兴起。因其相对精简的指令集架构(ISA)以及开源宽松的BSD协议近年来发展较快,国内阿里平头哥、国芯科技等企业推出了基于RISC-V架构的相关嵌入式CPU产品。本期芯东西内参,我们推荐国金证券的报告《中流击水—六大国产CPU厂商分析》,揭秘六大国产CPU厂商的最新发展格局。如果想收藏本文的报告,可以在芯东西公众号回复关键词“nc680”获取。来源 国金证券原标题:《中流击水—六大国产CPU厂商分析》作者:孟灿
▲华为芯片全景图其中鲲鹏处理器基于Armv8指令集永久授权,自主研发设计处理器内核,兼容全球 Arm生态。华为围绕鲲鹏处理器打造了“算、存、传、管、智”五个子系统的芯片族,实现全场景处理器布局。当前其鲲鹏芯片族正沿着“量产一代、研发一代、规划一代”的策略持续升级产品。2019年,华为发布鲲鹏920处理器。该芯片支持Armv8.2指令集,是行业内首款7nm数据中心Arm处理器。鲲鹏920由华为自主研发,采用多****、乱序执行、优化分支预测等多种手段提升单核性能。鲲鹏920拥有64个内核,集成8通道DDR4,可以提供多个接口,主频可达2.6GHz,总内存带宽最高可达1.5Tb/s,支持PCIe 4.0及CCIX接口,总带宽640Gbps。华为 Cache一致性总线(HCCS)的480Gbps片间互联支持最多4颗鲲鹏920互联和最高 256个物理核的NUMA架构,保证了鲲鹏920超强算力的高效输出。
▲鲲鹏920处理器关键特性
▲鲲鹏920 SPECINT 2006横向对比华为也在构建openEuler开源社区,高效推进处理器深度优化。openEuler开源社区以 Linux kernal、GNU等为上游社区,定期同步上游社区创新成果,并针对鲲鹏处理器进行深度优化,提供完整OS开发环境和上下游生态验证环境,使开发者和用户高效开展需求适配、生态集成和测试认证。
▲OpenEuler开源社区鲲鹏计算产业生态不断扩大。鲲鹏计算产业是基于鲲鹏处理器构建的全栈IT基础设施、行业应用及服务,包括PC、服务器、存储、操作系统、中间件、虚拟化、数据库、云服务、行业应用以及咨询管理服务等。
▲鲲鹏计算产业首批厂家该路线是华为提出的六大数字技术生态之一,除鲲鹏外还包括昇腾、HMS、鸿蒙、华为云、MDC(智能驾驶计算平台)。其中鲲鹏是华为面向政企市场,与地方政府和合作伙伴共同打造鲲鹏产业生态、构建具有国际竞争力的通用计算技术路线。华为鲲鹏得到了地方政府的大力支持。2020年4月,成都市印发《关于加快培育发展鲲鹏产业工作方案的通知》,明确2025年成都鲲鹏产业规模超过500亿元,并成为全国领先的鲲鹏软件生态基地、鲲鹏硬件制造基地和鲲鹏应用示范基地,该案例为鲲鹏产业体系的推进提供了重要模板。
▲飞腾腾云S2500性能提升明显其2020年发布的腾云系列新一代可扩展多路服务器芯片腾云S2500与FT 2000+相比性能大幅提升。在整机性能方面,双路的SPECint分值为原来的2倍,四路的SPECint 值为原来的3.5倍;在分布式数据库性能方面,双路服务器的tpmc值线性提升至原来的2倍,四路的tpmc值线性提升至原来的4倍;在云桌面支持方面,双路服务器支持虚拟机70个,是原来的2.5倍,四路服务器支持140个,是原来的5倍。相比上一代产品FT-2000/4桌面处理器芯片,最新飞腾高效能桌面CPU腾锐D2000的性能大幅跃升,带宽达18.7GB/s,SPECint分值为97.45,SPECfp分值为94.62,接近原来的2倍,在计算能力上得到进一步提升,并兼顾桌面终端与边缘服务器。此外,腾锐D2000与FT-2000/4产品管脚兼容,用户可以实现现有系统的原位拔插代换、无缝兼容。此设计能够大幅降低产品研发成本,同时降低整机合作伙伴的开发难度,加快开发进度。
▲腾锐D2000与飞腾其他产品的性能对比在生态建设方面,飞腾与1600余家国内软硬件厂商打造完整生态体系,与6大类 1000余种整机产品、2600余种软件和外设完成了适配;基于飞腾桌面CPU的终端已形成了较为完整的生态图谱,可覆盖从整机硬件、基础软件到上层的应用;基于飞腾桌面CPU的终端产品已能够实现海量安卓应用的运行,基于飞腾CPU的软件生态也在不断丰富和完善。飞腾是PKS体系领导者。PKS体系最早由飞腾CPU(Phytium)和麒麟操作系统(Kylin)组成的“PK体系”发展而来。依托飞腾全新的硬件级安全机制,以相关可信技术为支撑,PK体系融合“S-Security”的立体防护安全链,升级为PKS体系,并全球首创将“可信计算3.0”技术融入到CPU、操作系统和存储控制器中,实现底层构架的本质安全,并成为国内首个计算机软硬件基础体系标准。对比鲲鹏与飞腾的生态构建,可以发现,鲲鹏技术路线比PKS路线有较明显的技术和产品优势,PKS技术路线比鲲鹏技术路线有较明显的安全优势。
▲鲲鹏计算产业与PKS技术路线对照表其产品基于AMD Zen1架构,产品性能起点较高。对比英特尔在2020年(与海光7285 同期)发布的6款至强铂金系列产品(能够反映英特尔2020年发布的主流CPU产品的性能),在典型场景下,海光7285已接近国际同类高端产品水平。
▲海光7285与英特尔至强铂金系列产品对比

▲海光CPU主要规格和特点面向企业计算、云计算数据中心、大数据分析、人工智能、边缘计算等众多领域,海光信息提供了多种形态的处理器,满足互联网、电信、金融、交通、能源、中小企业等的广泛应用需求。
电信和金融是其产品应用最多的两个领域。基于前期电信、金融、互联网等行业对其产品的认可,海光信息在电信运营商集采、金融行业入围等方面市场份额增长较快,其产品在相关重点行业销量逐渐提升。
▲兆芯产品体系与解决方案兆芯通用处理器具备良好的操作系统和软硬件兼容性,生态体系成熟,支持构建台式机、笔记本、一体机、云终端等多种类型的桌面整机以及服务器、存储等产品。在嵌入式领域,也已经有不同规格基于兆芯通用处理器的工业主板、模块化电脑、工业整机、Box PC、工业级服务器、网络安全平台等产品陆续推出。
▲兆芯产品系列
▲兆芯KX-6000系列处理器横向对比
▲龙芯中科产品体系龙芯中科自主研发的LoongArch,具有较强的扩展性和自主性。LoongArch包括基础架构部分和向量指令、虚拟化、二进制翻译等扩展部分近2000条指令,具有较好的扩展性。LoongArch指令系统从整个架构的顶层规划,到各部分的功能定义,再到每条指令的编码、名称、含义,都进行了自主设计,具有充分的自主可靠性。此外,LoongArch充分考虑兼容需求,在定义时充分考虑了MIPS、x86、Arm、RISC-V等主要指令系统的特征,摒弃了传统指令系统中部分不适应当前软硬件设计技术发展趋势的陈旧内容,吸纳了近年来指令系统设计领域诸多先进的技术发展成果。同原有兼容指令系统相比,LoongArch不仅在硬件方面更易于高性能、低功耗设计,而且在软件方面更易于编译优化和操作系统、虚拟机的开发。
▲LoongArch架构优势基于自主指令系统(LoongArch)的3A5000/3B5000,是龙芯当前重点发展产品。
▲龙芯3A5000/3B5000产品参数从龙芯3A5000在SPEC CPU 2006 BASE性能测试中的表现来看,龙芯3A5000单核定点为25.1分,单核浮点为26分,相比英特尔i5 9500六核14nm有不小差距,但单核定点与国产Armv8四核7nm处理器不相上下,单核浮点略优。龙芯3A5000对比国产 Armv8八核14nm处理器的单核定点则高出近10分,单核浮点则高出近1倍。多线程测试中,英特尔i5 9500六核14nm处理器依然表现最佳,而龙芯3A5000的多核定点与多核浮点均高于国产Armv8四核7nm处理器,由于国产Armv8八核14nm处理器核心数量上具有一定的优势,因此定点和浮点的分数要高于龙芯3A5000和国产 Armv8四核7nm处理器。龙芯3A5000在主流内存带宽测试程序Stream Copy的子项性能测试中表现出色,表现超过英特尔i5 9500六核14nm处理器。其Copy单线性能获得16864分,多线性能获得21873分。国产Armv8八核14nm处理器和国产Armv8四核7nm处理器分数相差不大,但整体表现比龙芯3A5000稍逊一筹。龙芯秉承独立自主和开放合作的运营模式,从指令集/IP核授权、到芯片级/主板级开发以及系统内核应用等方面对生态伙伴进行全方位的开放支持。目前龙芯的信息化合作伙伴达到上千家,可以提供基于龙芯从端到云的完整解决方案,相关软硬件开发人员数万人。龙芯开源社区(www.loongnix.cn)是龙芯CPU的基础软件生态建设平台,由龙芯中科组织并联合产业链合作厂商、国际开源软件社区及开源爱好者共同参与建设。社区以“开源、开放”的形式进行管理,设置BIOS、Linux内核、GCC编译器、Java虚拟机、浏览器、媒体解码库、图形桌面、KVM虚拟机等重要基础软件项目。经过多年建设,信息化应用中的主流编程语言和开发环境已在龙芯平台上得到支持。
▲龙芯的开源社区建设
▲申威主要产品系列出于安全性能以及知识产权角度,申威在研发出第一代基于Alpha指令集的CPU后,将指令集替换为自研的自主可控申威64位指令集,完全区别于原有Alpha指令集。申威处理器专注于高性能计算,尤其是在服务器领域,浮点运算算力与同期外国处理器相当。申威SW26010是中国首个采用国产自研架构且性能强大的计算机芯片。
▲申威26010性能对比申威26010处理器的峰值性能大于每秒12.5万万亿次浮点运算结果,峰值速度、持续性能、性能功耗比排在世界前列。
▲终端处理器性能对比(SPEC分值)经过长期稳定的研发,基于系列申威芯片的各种产品也逐渐增多,在保障特种领域应用和国家战略任务的前提下,随着其产品技术的日益成熟,其生态也不断完善。
▲申威生态芯东西认为,经过多年发展,六大国产CPU主流玩家,各具优势,也各存短板。考虑到产品性能和生态优势,短期内海光信息、华为鲲鹏、飞腾在市场化道路上预计更为好走。但目前尚未见哪家在高自主化程度、高商用市场接受程度方面做到两全,国产化道路依然曲折漫长。在自主可控长期需求的驱动下,国产CPU龙头需更有定力,肩负起可持续的技术创新研发重任,才有能力参与到更长期的国际竞争中。*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。