包子侯爵 发表于 2016-6-20 22:14:34

260核心!中国全新超算自主CPU揭秘:举世震惊

天河二号在全球超级计算机排行榜上垄断冠军宝座长达3年之后,同样来自中国的神威太湖之光(Sunway TaihuLight MPP)凭借每秒12.54亿亿次的峰值计算性能,强势登顶。这是全球第一台性能突破10亿亿次的超算,同时达到了天河二号的2.3倍!  比夺冠更令人惊喜的是,在最核心的CPU处理器技术上,我们也终于不再依赖国外技术。天河二号使用的是Intel Xeon、Xeon Phi处理器, 神威太湖之光则是我国自主研发的“SW26010”。  http://n1.itc.cn/img8/wb/recom/2016/06/20/146641694925709369.JPEG  http://n1.itc.cn/img8/wb/recom/2016/06/20/146641694935257523.JPEG  根据目前已知的资料,SW26010采用的是 64位RISC(精简指令集)架构,但据称又有些类似Intel Xeon Phi,是专为高性能计算研发的。  每一颗这样的处理器都集成多达260个核心(每四个核心一组),主频1.45GHz,理论浮点性能3TFlops,搭配32GB内存。  整套系统使用了40960颗处理器,总计拥有10649600颗核心、1.31PB内存,理论峰值性能125435.9TFlops,实际最大性能93014.6TFlops,效率达74%,相比之下天河二号的效率只有62%。  SW26010处理器的工艺不详,但整套超算的能效很高, 总功耗只有15371千瓦,比天河二号还低了2437W,因此在关注能效的Green500排行榜上同样名列前茅。高举第三位。  http://n1.itc.cn/img8/wb/recom/2016/06/20/146641694973189386.JPEG  http://n1.itc.cn/img8/wb/recom/2016/06/20/146641694986265150.JPEG  在号称“超算奥斯卡”的2016年度戈登贝尔奖的6个提名中,“神威太湖之光”已经拿下了3个,分别涉及大气、海洋、材料三个领域的应用,今年有望实现我国在这个奖项上零的突破。  其实早在2011年,上一代产品神威蓝光(Sunway BlueLight MPP)就曾经获得国内TOP100超算排名桂冠,也是中国第一款自主芯片的千万亿次超级计算机。  http://n1.itc.cn/img8/wb/recom/2016/06/20/146641695000329436.JPEG  值得一提的是,国际超算行业已经陷入多年沉寂,本次TOP10除了神威太湖之光一举夺魁之外,其他九台都和以前一模一样。  本次TOP500排行榜上, 中国军团也在历史上首次超过美国,达到了167台,占整体的1/3,比美国多出两台,同时遥遥领先其他各国:第三的日本才29台。  中国这167台超算的总性能则达到了211.07PFlops,占比达37.2%,美国则只有30.6%,可见中国超算的效率也是一流的。  http://n1.itc.cn/img8/wb/recom/2016/06/20/146641695012219375.PNG  http://n1.itc.cn/img8/wb/recom/2016/06/20/146641695033895293.PNG

http://www.ithome.com/html/discovery/234951.htm
在今天公布的全球TOP500超算排名中,中国不仅保住了最强计算机的荣誉,而且在TOP500计算机数量上也实现了新突破,更关键的是在美国卡脖子之后中国用自己研发的处理器实现了超越,这次神威计算机不声不响地拿下TOP500冠军距离美国制裁中国超算中心不过一年零两个月。太湖之光超级计算的背后是中国国产处理器的大进步,它使用的是申威(跟计算机名别混了)SW26010处理器,260核心,64位架构,该系统的一大特色就是能效非常高,性能几乎是天河2号的三倍,但总功耗反而更低了。http://img.ithome.com/newsuploadfiles/2016/6/20160620_210501_89.jpg神威太湖之光:不仅性能最强,能效也逆天先来简单说说神威太湖太湖之光计算机,它坐落于太湖之滨的无锡市国家超算中心内,此前大出风头的天河2号则是在中国广州的国家超算中心。神威计算机的研发单位是中国国家并行计算机工程技术研究中心,在太湖之光之前该中心研发过神威蓝光计算机,2012年安装于济南的国家超算中心内,当年的浮点性能为1千万亿次,现在来看性能早已经不算领先了,不过当时蓝光也是国内自主研发的HPC,使用的就是国产处理器。http://img.ithome.com/newsuploadfiles/2016/6/20160620_210509_963.jpg神威太湖之光超级计算机简介在TOP500官网上可以找到太湖之光计算机的详细规格,其Linpack浮点性能为93PFLOPS,理论性能是125.4PLFOPS,而此前最强的天河2号性能分别是33.86LFOPS、54.9PFLOPS,也就是说太湖之光的实用性能几乎是天河2号的3倍,理论性能则是后者的2倍多,性能效率达到了74.2%,而天河2号只有55.8%。http://img.ithome.com/newsuploadfiles/2016/6/20160620_210511_909.jpg神威太湖之光的能效比非常高更关键的是,在性能大幅飙升的情况下,太湖之光的功耗反而从天河2号的17.8MW降低到了15.37MW,计算下来其单位性能功耗达到了6GFLOPS/W,而以能效比著称的“泰坦”单位性能不过是2.1GLOPS/W。太湖之光的能效就算放到以节能而非性能为指标的Green500计算机中也是拔尖的,后者最新榜单中排名第一的单位性能不过是7GFLOPS/W,第二名的是5.3GLOPS/W,太湖之光能成为第二,而这两台计算机的性能与太湖一号差太远了,最强的Shoubu也不过605TFLOPS(0.65PFOPS)。申威处理器:国产260核处理器神威计算机使用的处理器来源于上海江南计算所,神威蓝光计算机使用的是申威SW1600处理器,2010年问世,架构体系源于DEC Alpha(这个是喷点啊,喷子要注意了,申威指令集不是国产的),根据资料来看它使用的还是65nm工艺,16个RISC 64位核心,频率在975MHz到1200MHz之间,1.1GHz频率下浮点性能140.88GFLOPS。http://img.ithome.com/newsuploadfiles/2016/6/20160620_210514_374.jpg▲太湖之光使用的是申威SW26010处理器太湖之光显然不可能再使用神威1600处理器了,这次使用的是江南计算所研发的申威SW26010处理器,架构体系还是Alpha 64位RSIC,乱序执行,频率1.45GHz,260个核心,整个处理器包括4个MPE(Management Processing Element)管理单元、4个CPE(Computing Processing Element)计算单元及4个MC内存控制器单元组成,其中CPE单元又由8x8阵列的64核心组成,所以总计是260个核心(4x64+4=260)。这样1个处理器就是1个节点,每个节点8GB DDR3内存,256个节点组成1个超级节点,160个超级节点互联连接,因此总计是40960个节点,10649600个核心,内存容量1.3PB。http://img.ithome.com/newsuploadfiles/2016/6/20160620_210515_17.jpg▲每张计算卡上有2个节点http://img.ithome.com/newsuploadfiles/2016/6/20160620_210515_949.jpg▲每块主板上可以布置上下4张计算卡http://img.ithome.com/newsuploadfiles/2016/6/20160620_210516_850.jpg▲32张卡组成1个超级节点,或者说256个节点http://img.ithome.com/newsuploadfiles/2016/6/20160620_210517_484.jpg▲4个超级节点组成1组机柜http://img.ithome.com/newsuploadfiles/2016/6/20160620_210518_331.jpg▲太湖之光的整体布局要想了解太湖之光的详细架构信息,可以读读田纳西大学这篇论文。至于如何评价中国太湖之光到底有多强,可以看下论文中对比的美国最强HPC、中国前一代最强HPC及当前太湖之光的配置。http://img.ithome.com/newsuploadfiles/2016/6/20160620_210520_427.jpg

冰崶318 发表于 2016-6-20 22:29:57

咦,包子转入超级计算机级了

eocn 发表于 2016-6-20 22:53:14

{:6_230:}

别又是吹牛就行了.有实际的效果.

包子侯爵 发表于 2016-6-20 22:58:27

冰崶318 发表于 2016-6-20 22:29
咦,包子转入超级计算机级了

包子侯爵 发表于 2016-6-20 22:59:12

eocn 发表于 2016-6-20 22:53
别又是吹牛就行了.有实际的效果.

这制程和架构感觉是有点怪怪的 但是浮点和功耗看起来还可以啊

牛斯比卡 发表于 2016-6-21 01:05:55

为毛没有民用的

猎鹰 发表于 2016-6-21 02:38:50

还得看看软件做的咋样,中国的超算长期属于赔本的~~~~不过这次非常不错,至少硬件已经大量国产化了。

Blake 发表于 2016-6-21 08:55:00

新一代国产跑分神器又出现了{:5_148:}

firetiger999 发表于 2016-6-21 09:16:41

不知道能否投入民用来证明一把

wyzx01 发表于 2016-6-21 09:32:48

可以,很强势

viewtheard 发表于 2016-6-21 10:53:30

先说能不能挖矿。

海飞行家 发表于 2016-6-21 11:09:53

没民用的

Eltrion 发表于 2016-6-21 11:55:17

来跑个分

Freedom 发表于 2016-6-21 21:17:34

然而实际应用如何, 我就怕拿着纳税人的钱,吹牛皮,

z23wen 发表于 2016-6-22 15:52:59

这种专用计算卡,不是通用处理器,只能作为专用计算.
其实的AMD的通用计算卡性能也很强大,当然前提是能发挥出来。
FURY X 8.6TFLOPS的性能 250W的功耗,也有34.4GFLOPS/W的能耗比。
其实最重要的是,能发挥出该有的计算性能,据说也有用DSP来作为加速处理器,这玩意,功耗超低,性能超强。
10W的DSP就能超过250W的 FURY X的性能。
一种东西,有利有弊,要么专用不通用,功耗低,性能强
要么通用,功耗高点。
页: [1]
查看完整版本: 260核心!中国全新超算自主CPU揭秘:举世震惊