肠梗阻的症状

首页 » 常识 » 问答 » Zen架构国产海光x86CPU实测虽有
TUhjnbcbe - 2023/7/15 21:27:00
北京好皮炎专科医院 http://m.39.net/pf/a_9057218.html

这几年,国产CPU处理器突飞猛进,而且在不同架构上齐头并进,包括x86架构的兆芯、海光,MIPS架构的龙芯、君正,ARM架构的飞腾、鲲鹏,Alpha架构的申威,RISC-V架构的阿里玄铁等等。

其中,海光(Hygon)是一个非常特殊的存在,因为他居然拿到了AMD的官方授权(注意不是技术转让),而且是大获成功的最新Zen架构,在性能方面是最值得期待的,但到底能达到什么程度一直扑朔迷离。

最近,权威硬件评测网站AnandTech拿到了海光处理器,包括8核心的桌面版Dhyana、32核心的服务器版DhyanaPlus,进行了深入分析和测试。

一、AMD和海光的复杂合作

其实,海光能获得AMDx86架构授权是非常曲折的。虽然美国*府对此大开绿灯,但为了规避Intel专利限制和相关法律,绕了一个大圈子:

AMD、天津海光信息技术有限公司(天津海光)作为两家主体合作公司,通过合资的方式成立了两家新的公司,一个是成都海光微电子技术有限公司(海光微电子),另一个是成都海光集成电路设计有限公司(海光集成电路)。

海光微电子由AMD主要控股51%,拥有AMD授权IP(知识产权)并负责芯片生产,海光集成电路则由天津海光主要控股70%,负责芯片设计与销售。

而一颗海光处理器的诞生,可以分为11个步骤:

1、AMD将核心设计授权给海光微电子,并提供建议的SoC布局

2、海光微电子向海光集成电路提供芯片设计平面图

3、海光集成电路将修改建议反馈给海光微电子

4、AMD工程师审核修改建议,予以批准或否定

5、海光微电子将最终设计平面图返回给海光集成电路,并准备接订单

6、海光集成电路向海光微电子订购晶圆、硅片

7、海光微电子联系GlobalFoundries进行代工制造

8、GlobalFoundries按照设计达成预定频率/电压、良品率

9、海光微电子将完整硅片卖给海光集成电路

10、海光集成电路在中国国内完成硅片封装

11、海光集成电路在中国内地市场销售成品处理器

是不是绕晕了?没办法,想获得最先进技术,就是这么难。

特别注意的是,海光获得的只是AMD14nmZen架构的IP授权,而不是完整的技术转让,底层设计和技术、专利依然属于AMD,海光只能在高级层面根据自己的需要进行修改、定制。

打个比方,技术转让相当于买了块地皮,你就是房地产商,可以自己规划盖高楼,想怎么盖就怎么盖,ARM架构的华为麒麟等就是这种。

IP授权相当于买了个毛坯房,你只是业主,可以自己装修、安装家具,但不能改变楼房结构,墙壁里安装个窃听器你也没办法。

并且,AMD授权的也不是完完整整的Zen架构,而是阉割后的残血版,性能和锐龙、霄龙相比不在一个层次上,所以对后边的测试成绩要做好心理准备。

但无论如何,你付了钱买了房子,你就是主人,所以海光确确实实是一款国产处理器,而且能对如此复杂、先进的x86架构吸收并改进设计,并不是谁都能做到的。

采用海光处理器的曙光工作站

二、海光Zen架构的阉割与修改

海光并非直接把AMDZen架构芯片拿过来打磨改个名,AMD也没这么大方,一方面允许自行修改设计,但另一方面也在架构规格上做了不少精简。

这方面没有任何官方资料,AMD、海光都异常低调、守口如瓶,但是通过各种分析检测,AnandTech还是发现了很多秘密。

1、基本架构不变

海光处理器在核心布局上和原版Zen完全相同,缓存容量、TLB容量、端口布局等都没变,比如一级指令缓存4路64KB,一级数据缓存8路32KB,二级缓存8路KB,三级缓存16路8MB。

测试显示,内存访问时间一级缓存4个周期、二级缓存12个周期、三级缓存37-40个周期,内存延迟-个周期。

一级缓存读取速度每核心约GB/s,写入速度约51GB/s。八核心的DDR4内存读取速度38.5GB/s,写入速度35.8GB/s。

Zen架构内核简图

2、新的加密机制

出于安全考虑,海关在这方面做了大刀阔斧的改变。

Zen架构的霄龙中有AMDSEV虚拟化加密技术,涉及RSA、ECDSA、ECDH、SHA、AES等加密算法,海光则改成了我国自己发布的SM2、SM3、SM4,更有可控性。

SM2是椭圆曲线公钥密码算法,相比于RSA更先进、更节能、更安全,国家密码管理局年12月17日发布。

SM3是哈希算法,属于密码散列函数标准,用于数字签名及验证、消息认证码生成及验证、随机数生成等,原理、安全性和效率都类似SHA-,国家密码管理局年12月17日发布。

SM4是分组密码算法,用于数据加密,分组和秘钥长度都是位,类似AES-,国家密码管理局年3月21日发布。

Linux内核也加入了相应的指令,以支持这些加密算法,不过有趣的是,他们不但在海光处理器上测试成功,AMD霄龙上也能运行。

3、指令集大缩水

这是AMD下手最狠的地方,大量指令要么把速度降了下来,要么直接砍了,对性能影响非常大。

测试发现,海光获得架构的整数性能基本没变,但是浮点性能损失很大,DIV、SQRT等浮点指令直接消失,大量的MMX/SSE简单指令则被降速:

这些都是基础指令,对于日常基本性能至关重要,速度变慢直接就把实际性能给拉了下来。

另外,桌面版Dhyana、服务器版DhyanaPlus的差别也很大,比如至关重要的随机数生成算法,就在服务器版上严重削弱。

RDRAND算法在海光这边其实更快了,服务器版上更是快得多,RDSEED算法在海光桌面上也加快了,但服务器上慢了足有10倍之多。

事实上,二者都可以在海光的BIOS里选择开启或关闭。

AVX、AVX2指令集也很奇怪,检测显示海光是支持的,但似乎已被禁用,相关测试根本无法运行,AESNI、SHA、CLMUL、FMA4、BMI、BMI2等指令无一例外。

缺少这些指令会影响到什么程度呢?比如AES编码,两颗32核心的海光竟然都跑不过入门级的4核心锐龙:

三、海光处理器就长这样

说了半天,是时候请出本尊了。

这是一个8核心海光桌面处理器的工程样品,表面印有HYGON中科海光的标识,“用芯计算未来”的口号,还能看到成都封装字样,但没有具体型号和规格。

C86应该是代表Chinax86。

不同于AM4独立封装的AMD锐龙,海光采用BGA整合封装,直接焊接在主板上,无法更换和升级,辅以简单的6相供电,不过奇怪的是,散热器安装孔距并非AMDAM4规格,而是Intel的。

整体板型为mciroATX,供电接口有24针主供电、8针辅助供电和D形大4针辅助供电。还有两块电池,一块显然是保存BIOS,另一块未知。

两条内存插槽位于处理器上方,典型的服务器布局以方便散热,另有四个SATA6Gbps磁盘接口、两条PCIe3.0x16和一条PCIe3.0x4扩展插槽。

海光其实也是SoC,为了扩展输入输出搭配了一颗LatticeSemiconductorFPGA,提供SATA接口、四组LED指示灯和各种定制接口、插针、按钮。

集成GPU当然没有,使用的是服务器上常见的IPMI控制器和ASPEEDAST芯片,提供简单的2D图形输出。

放上去一颗锐龙处理器,尺寸是完全一样的。

这是32核心的海光服务器版本,外形尺寸和线程撕裂者、霄龙几乎一模一样,也有保护支架,同时表面可以看到的型号标识,其他类似桌面版。

服务器整机来自曙光,面向计算和存储市场,双路共计64核心,每路支持4块U.2硬盘、16块SATA硬盘,内存支持八通道,但本次测试因为一些限制跑的是四通道。

CPU-Z软件还不支持海光,服务器版直接无法运行,桌面版也只能检测出极少量信息,比如八个核心、3.2GHz主频,但奇怪的是,指令集里显示有AVX、AVX2、FMA3,但实际测试却无法用上,至少目前还没找到能利用的方法。(其实应该用AIDA64检测的,去年已支持海光。)

四、终于要跑分了

测试中,8核桌面海光搭配Windows10专业版,双路32核服务器海光搭配Windows10企业版,但由于AVX、AVX2指令集不正常,很多测试无法跑,项目有限。

8核海光的性能大致类似6核锐龙X、8核锐龙X,但在特定测试中甚至可能还不如双核速龙GE,比如最后一项GeekBench4单线程加密性能。

双路32核海光的表现一团糟,很多时候还不如锐龙X,当然更没法和锐龙X甚至是撕裂者相比,唯一较好的就是更突出整数性能的Corona,可见浮点指令集削减造成的严重影响。

五、难得机遇意义非凡

可能看完跑分,大家会感到非常失望,坦白地说乍一看确实也有点出乎意料,但其实也是合情合理的。

x86CPU架构作为Intel、AMD两家美国巨头的核心资产,是绝对不会轻易外泄的,尤其是Zen这样非常成功的最新架构,按照一般逻辑我们能拿到手的可能性应该是零,以往想都不敢想,但是在各种因素的促成下,它确确实实到了我们手中。

AMD对海光的架构底层开放程度到底是什么层次,我们不得而知,但确确实实整套搬了过来,尽管规格上有些缩水但并没有本质性的削减,而且允许海光自行修改、设计(尤其是敏感的安全加密),已经足够我们的科研人员研究很久很久了。

可以说,这是一次空前难得的历史机遇,可以让我们一窥最新、最先进的集成电路设计,获得极为宝贵的经验,这次的合作模式也值得思考和借鉴。

可能在未来很长时间里,都不会再有这样的机会了,至少AMD已经明确表态,后续的Zen2/3/4等等无意继续授权给海光。

整体来看,无论是桌面上还是服务器上,海光处理器的性能确实很平淡,毕竟指令集等关键特性做了大幅度的削减,对于这么先进架构的研究、优化也需要时间。

但是海光处理器的意义,绝不是达到多高的性能,而是有了一个全新的开端和突破。对于一些特殊、敏感的行业和领域,目前需要的也不是绝对高性能,而是首先解决有无的问题,解决能用的问题。

而且我们还有兆芯,来自威盛的x86技术,虽然架构技术相对Intel、AMD差了很多,但是在我们手里的自由度更大,满足一些特定需求是毫无问题的,甚至已经开始向零售市场渗透。

路,总是要一步一步走的,只要坚持走下去,就有希望,就有未来,更何况,我们的路还不止一条。

1
查看完整版本: Zen架构国产海光x86CPU实测虽有