Red Team 红色小队论坛

 找回密码
 立即注册
查看: 4723|回复: 14

260核心!中国全新超算自主CPU揭秘:举世震惊

  [复制链接]

190

主题

2094

帖子

2万

积分

铁杆A饭

5820K + Fury X + 追风者 ES515ETG_

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
10766
经验
10
贡献
43
发表于 2016-6-20 22:14:34 | 显示全部楼层 |阅读模式

马上注册加入红色小队,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

天河二号在全球超级计算机排行榜上垄断冠军宝座长达3年之后,同样来自中国的神威太湖之光(Sunway TaihuLight MPP)凭借每秒12.54亿亿次的峰值计算性能,强势登顶。这是全球第一台性能突破10亿亿次的超算,同时达到了天河二号的2.3倍!

  比夺冠更令人惊喜的是,在最核心的CPU处理器技术上,我们也终于不再依赖国外技术。天河二号使用的是Intel Xeon、Xeon Phi处理器, 神威太湖之光则是我国自主研发的“SW26010”。

  

  

  根据目前已知的资料,SW26010采用的是 64位RISC(精简指令集)架构,但据称又有些类似Intel Xeon Phi,是专为高性能计算研发的。

  每一颗这样的处理器都集成多达260个核心(每四个核心一组),主频1.45GHz,理论浮点性能3TFlops,搭配32GB内存。

  整套系统使用了40960颗处理器,总计拥有10649600颗核心、1.31PB内存,理论峰值性能125435.9TFlops,实际最大性能93014.6TFlops,效率达74%,相比之下天河二号的效率只有62%。

  SW26010处理器的工艺不详,但整套超算的能效很高, 总功耗只有15371千瓦,比天河二号还低了2437W,因此在关注能效的Green500排行榜上同样名列前茅。高举第三位。

  

  

  在号称“超算奥斯卡”的2016年度戈登贝尔奖的6个提名中,“神威太湖之光”已经拿下了3个,分别涉及大气、海洋、材料三个领域的应用,今年有望实现我国在这个奖项上零的突破。

  其实早在2011年,上一代产品神威蓝光(Sunway BlueLight MPP)就曾经获得国内TOP100超算排名桂冠,也是中国第一款自主芯片的千万亿次超级计算机。

  

  值得一提的是,国际超算行业已经陷入多年沉寂,本次TOP10除了神威太湖之光一举夺魁之外,其他九台都和以前一模一样。

  本次TOP500排行榜上, 中国军团也在历史上首次超过美国,达到了167台,占整体的1/3,比美国多出两台,同时遥遥领先其他各国:第三的日本才29台。

  中国这167台超算的总性能则达到了211.07PFlops,占比达37.2%,美国则只有30.6%,可见中国超算的效率也是一流的。

  

  



http://www.ithome.com/html/discovery/234951.htm

[size=1pc]在今天公布的全球TOP500超算排名中,中国不仅保住了最强计算机的荣誉,而且在TOP500计算机数量上也实现了新突破,更关键的是在美国卡脖子之后中国用自己研发的处理器实现了超越,这次神威计算机不声不响地拿下TOP500冠军距离美国制裁中国超算中心不过一年零两个月。太湖之光超级计算的背后是中国国产处理器的大进步,它使用的是申威(跟计算机名别混了)SW26010处理器,260核心,64位架构,该系统的一大特色就是能效非常高,性能几乎是天河2号的三倍,但总功耗反而更低了。

[size=1pc]

[size=1pc]神威太湖之光:不仅性能最强,能效也逆天

[size=1pc]先来简单说说神威太湖太湖之光计算机,它坐落于太湖之滨的无锡市国家超算中心内,此前大出风头的天河2号则是在中国广州的国家超算中心。神威计算机的研发单位是中国国家并行计算机工程技术研究中心,在太湖之光之前该中心研发过神威蓝光计算机,2012年安装于济南的国家超算中心内,当年的浮点性能为1千万亿次,现在来看性能早已经不算领先了,不过当时蓝光也是国内自主研发的HPC,使用的就是国产处理器。

[size=1pc]

[size=1pc]神威太湖之光超级计算机简介

[size=1pc]在TOP500官网上可以找到太湖之光计算机的详细规格,其Linpack浮点性能为93PFLOPS,理论性能是125.4PLFOPS,而此前最强的天河2号性能分别是33.86LFOPS、54.9PFLOPS,也就是说太湖之光的实用性能几乎是天河2号的3倍,理论性能则是后者的2倍多,性能效率达到了74.2%,而天河2号只有55.8%。

[size=1pc]

[size=1pc]神威太湖之光的能效比非常高

[size=1pc]更关键的是,在性能大幅飙升的情况下,太湖之光的功耗反而从天河2号的17.8MW降低到了15.37MW,计算下来其单位性能功耗达到了6GFLOPS/W,而以能效比著称的“泰坦”单位性能不过是2.1GLOPS/W。太湖之光的能效就算放到以节能而非性能为指标的Green500计算机中也是拔尖的,后者最新榜单中排名第一的单位性能不过是7GFLOPS/W,第二名的是5.3GLOPS/W,太湖之光能成为第二,而这两台计算机的性能与太湖一号差太远了,最强的Shoubu也不过605TFLOPS(0.65PFOPS)。

[size=1pc]申威处理器:国产260核处理器

[size=1pc]神威计算机使用的处理器来源于上海江南计算所,神威蓝光计算机使用的是申威SW1600处理器,2010年问世,架构体系源于DEC Alpha(这个是喷点啊,喷子要注意了,申威指令集不是国产的),根据资料来看它使用的还是65nm工艺,16个RISC 64位核心,频率在975MHz到1200MHz之间,1.1GHz频率下浮点性能140.88GFLOPS。

[size=1pc]

[size=1pc]▲太湖之光使用的是申威SW26010处理器

[size=1pc]太湖之光显然不可能再使用神威1600处理器了,这次使用的是江南计算所研发的申威SW26010处理器,架构体系还是Alpha 64位RSIC,乱序执行,频率1.45GHz,260个核心,整个处理器包括4个MPE(Management Processing Element)管理单元、4个CPE(Computing Processing Element)计算单元及4个MC内存控制器单元组成,其中CPE单元又由8x8阵列的64核心组成,所以总计是260个核心(4x64+4=260)。

[size=1pc]这样1个处理器就是1个节点,每个节点8GB DDR3内存,256个节点组成1个超级节点,160个超级节点互联连接,因此总计是40960个节点,10649600个核心,内存容量1.3PB。

[size=1pc]

[size=1pc]▲每张计算卡上有2个节点

[size=1pc]

[size=1pc]▲每块主板上可以布置上下4张计算卡

[size=1pc]

[size=1pc]▲32张卡组成1个超级节点,或者说256个节点

[size=1pc]

[size=1pc]▲4个超级节点组成1组机柜

[size=1pc]

[size=1pc]▲太湖之光的整体布局

[size=1pc]要想了解太湖之光的详细架构信息,可以读读田纳西大学这篇论文。

[size=1pc]至于如何评价中国太湖之光到底有多强,可以看下论文中对比的美国最强HPC、中国前一代最强HPC及当前太湖之光的配置。

[size=1pc]



Be AMDish

74

主题

1521

帖子

3万

积分

铁杆A饭

生命无take two

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
27608
经验
10
贡献
25
QQ
发表于 2016-6-20 22:29:57 | 显示全部楼层
咦,包子转入超级计算机级了
DIY...

33

主题

1201

帖子

1万

积分

铁杆A饭

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
6173
经验
10
贡献
5
发表于 2016-6-20 22:53:14 | 显示全部楼层


别又是吹牛就行了.有实际的效果.
CPU:i7 6700k
散热:九州风神水元素240T+NB2400
主板:技嘉Z170X-UD3
内存:十铨DDR4 3000 8G*2
固态:威刚Sp920 256G +台电极光系列 480G
硬盘:希捷1T 7200
显卡:XFX 480黑狼进化*2
电源:XFX XTS 1000W 白金+XFX Ti定制线
机箱:追风者515Pa+追风14Cm风扇*4

190

主题

2094

帖子

2万

积分

铁杆A饭

5820K + Fury X + 追风者 ES515ETG_

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
10766
经验
10
贡献
43
 楼主| 发表于 2016-6-20 22:58:27 | 显示全部楼层
冰崶318 发表于 2016-6-20 22:29
咦,包子转入超级计算机级了

Be AMDish

190

主题

2094

帖子

2万

积分

铁杆A饭

5820K + Fury X + 追风者 ES515ETG_

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
10766
经验
10
贡献
43
 楼主| 发表于 2016-6-20 22:59:12 | 显示全部楼层
eocn 发表于 2016-6-20 22:53
别又是吹牛就行了.有实际的效果.

这制程和架构感觉是有点怪怪的 但是浮点和功耗看起来还可以啊
Be AMDish

0

主题

9

帖子

169

积分

R100

Rank: 2

精华
0
金币
90
经验
10
贡献
0
发表于 2016-6-21 01:05:55 | 显示全部楼层
为毛没有民用的

83

主题

520

帖子

1万

积分

Tahiti

Rank: 12Rank: 12Rank: 12

精华
0
金币
11115
经验
10
贡献
5
发表于 2016-6-21 02:38:50 | 显示全部楼层
还得看看软件做的咋样,中国的超算长期属于赔本的~~~~不过这次非常不错,至少硬件已经大量国产化了。
ThreadRipper 2950X
256G ECC
Vega FE CF
AX1500i
Intel 750 1.2TB
以上配置不是我的

10

主题

242

帖子

8448

积分

RV670

Rank: 8Rank: 8

精华
0
金币
6736
经验
10
贡献
0
发表于 2016-6-21 08:55:00 | 显示全部楼层
新一代国产跑分神器又出现了

1

主题

15

帖子

504

积分

R300

Rank: 3Rank: 3

精华
0
金币
359
经验
10
贡献
0
发表于 2016-6-21 09:16:41 | 显示全部楼层
不知道能否投入民用来证明一把

22

主题

221

帖子

8981

积分

RV670

Rank: 8Rank: 8

精华
1
金币
5040
经验
10
贡献
14
发表于 2016-6-21 09:32:48 | 显示全部楼层
可以,很强势

48

主题

276

帖子

1万

积分

Cayman

Rank: 11Rank: 11Rank: 11Rank: 11

精华
0
金币
9902
经验
10
贡献
0
发表于 2016-6-21 10:53:30 | 显示全部楼层
先说能不能挖矿。
AMD FX8150
玩家国度890FX
TEAM 4*8GB 1866 OC
蓝宝石R9 380 OC
三星850EVO 120MB+美光MX500 1GB
海盗船RM850x

0

主题

5

帖子

90

积分

R100

Rank: 2

精华
0
金币
55
经验
10
贡献
0
发表于 2016-6-21 11:09:53 | 显示全部楼层
没民用的

4

主题

27

帖子

2927

积分

R480

Rank: 4

精华
0
金币
2180
经验
10
贡献
5
发表于 2016-6-21 11:55:17 | 显示全部楼层
来跑个分

62

主题

2013

帖子

2万

积分

Vega10

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

精华
1
金币
18999
经验
10
贡献
0
发表于 2016-6-21 21:17:34 | 显示全部楼层
然而实际应用如何, 我就怕拿着纳税人的钱,吹牛皮,

79

主题

816

帖子

1万

积分

Polaris

Rank: 14Rank: 14Rank: 14Rank: 14

精华
0
金币
13841
经验
10
贡献
0
发表于 2016-6-22 15:52:59 | 显示全部楼层
这种专用计算卡,不是通用处理器,只能作为专用计算.
其实的AMD的通用计算卡性能也很强大,当然前提是能发挥出来。
FURY X 8.6TFLOPS的性能 250W的功耗,也有34.4GFLOPS/W的能耗比。
其实最重要的是,能发挥出该有的计算性能,据说也有用DSP来作为加速处理器,这玩意,功耗超低,性能超强。
10W的DSP就能超过250W的 FURY X的性能。
一种东西,有利有弊,要么专用不通用,功耗低,性能强
要么通用,功耗高点。
葵花在手,啊哈哈哈哈哈哈!
江山我有,啊哈哈哈哈哈哈!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表