芯片技术落后的中国,是如何造出超级计算机的?

编辑:沫之夏 2019-09-23 20:12:52

2019年,超级计算机排行榜出炉。美国人在多年之后,终于依靠Summit重新成为世界第一。而在此之前,中国的太湖之光已经蝉联四届第一。

相比Summit中nVIDIA GPU使用的12nm工艺(今年nVIDIA可能升级到7nm),神威太湖之光的28nm可以算古董级的工艺了。

明明工艺落后,为何中国的神威太湖之光,却能在超级计算机的排行榜上排名第一达四年之久呢?这背后的奥秘是什么呢?

一、 神威的来源

神威太湖之光是江南所制造的,江南所全称是无锡江南计算技术研究所,很早就开始对自主高性能计算机的研发。

神威用的处理器是申威(以前处理器也叫神威),这款处理器时,是从美国DEC公司的Alpha处理器衍生出来的。

当时,美国各家大的计算机公司都有自己的指令集和处理器,DEC公司也不例外,而DEC的Alpha系列是当时的明星处理器,同时代浮点性能是最强大的。

然而,成功的处理器不一定能让企业成功。1998年Compaq收购DEC,2002年,惠普康柏合并。而惠普有自己的PA-RISC指令集。

于是,Alpha的东西就卖给中国了,价格不便宜,这是申威的起源。

Alpha当年的思想是很先进的,AMD的K7就有Alpha的影子,英特尔P4的超线程技术是Alpha的。当年桌面CPU还在从单核心向双核心进化,而Alpha的21364已经考虑64个核心的之间的高效通信问题了。

现在,被媒体捧成大神的Jim Keller,当年就是在Alpha设计团队中成长的。

DEC被收购后,他去了AMD,参与设计了K7,是K8项目的主设计师。结果,AMD在那几年吊打Intel。

移动时代,Jim Keller去了PA-Semi,这家公司是由Daniel W. Dobberpuhl在2003年创立,和Jim Keller一样,他也曾在DEC工作,同时他还是Alpha 21064 和StrongARM处理器的主设计者。

就是说,PA-Semi也是Alpha的血脉。结果。PA-Semi给苹果收购,从A5,一直做到今天吊打ARM公版的A13处理器。

你今天用的iPhone,iPad,同样有Alpha的血脉。

从苹果离开后,Jim Keller再去AMD,设计了Zen。今年Zen2重新吊打一次英特尔。

目前,Jim Keller在英特尔准备大招。

Alpha当年提出的很多东西都是超前的,EV7总线,超线程,多核心的通信问题。今天,我们用的英特尔、AMD,苹果A系列处理器都有Alpha的遗产。

所以,重金买下Alpha,给神威一个非常好的底子。

二、江南所的创新

江南所拿到Alpha以后,2006年设计出具有自主微结构的申威1,130nm制程工艺的单核心CPU,主频900MHz,集成5700万晶体管。2008年完成的申威2,是一款130nm制程工艺的双核CPU,主频1.4GHz。

这么落后的工艺做到这么高的主频,因为江南所当时和代工厂有深度合作,优化提升主频,实际性能不错。

2010年,申威1600用65nm制程工艺的16核CPU,主频1.1G,双精浮点140G。申威1600被用于神威蓝光超算。

在技术指标上,16核心的神威1600在1.1ghz的时候,双精度浮点运算能力是140.8G,i7 980xe 6核心在3.2ghz,双精度浮点是107.55G。i7的功耗是130W,神威1600的功耗是70W。神威在性能功耗比上已经超越了当时的Intel。而神威的工艺落后,65nm对32nm。

太湖之光用的是申威26010,双精浮点峰值为3.06TFlops,与Kight Landing处在同一水平线。

申威26010采用了“CPU+加速器”的方案(管理核心+运算核心),为64位RISC(主频1.45GHz),拥有260个处理核心和4个内存控制器。处理器内包括四个核心组,每组有65个内核,由8×8 Mesh架构计算集群(CPE)、一个管理单元(MPE)、一个内存控制器(MC)组成。

这个理念属于众核,其实当年alpha21364就考虑过64个核的通信问题,神威有个好底子。

后来众核流行,大家都堆小核心,神威的架构正合适,这个东西做超算是合适的。

超级计算机的美国大牛曾经考察过江南所的神威太湖之光。他惊异的发现,中国人把美国最优秀的超级计算机Cray T3D做到了芯片上面。

在工艺落后于英特尔两代的情况下,做出不低于英特尔的性能。一定功耗内,堆核心数量超过英特尔的超级计算机,性能就是世界第一。

由于指令集的差异,江南所的神威太湖之光浮点性能远好于X86指令集的英特尔处理器。

所以,能够追赶神威的,都是采用nVDIAI异构计算的超级计算机。

领先四年后,才被工艺先进数代的产品赶超。江南所自己的创新也毋庸置疑。

三、未来的超级计算机

2019年,中国的神威太湖之光被美国赶超。但是从工艺看,落后两代。

看单核心性能,神威用今天的角度看也很羸弱。28nm 2Ghz 大约是2Ghz ARM A75-A76的水平。与ARM阵营像苹果A12、A13使用的CPU核心结构落后很多。

神威强大在于架构先进,核心之间互联通讯的开销小。

而随着技术的发展,神威是可以提升工艺与单核心性能的,现在中芯国际的12nm已经量产,7nm的evu指日可待。未来神威重回世界第一只是时间问题。

特别声明:本文为DoNews签约作者原创,文章版权归原作者及原出处所有。转载请联系DoNews专栏获取授权。(有任何疑问都请联系idonews@donews.com)

复制本文地址:http://www.zhuangjib.cn/dnzjz/1863.html

网站地图