Red Team 红色小队论坛

 找回密码
 立即注册
查看: 2560|回复: 9

不怕美国禁售!新天河自主超算芯片公布

[复制链接]

190

主题

2094

帖子

2万

积分

铁杆A饭

5820K + Fury X + 追风者 ES515ETG_

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
10779
经验
10
贡献
43
发表于 2015-7-21 10:32:02 | 显示全部楼层 |阅读模式

马上注册加入红色小队,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
From:http://cpu.zol.com.cn/531/5312448.html

天河2号再一次称霸全球超算性能榜单(性能最大33.83PFlops,千万亿次浮点计算),虽然仍处在建设中,但它已经史无前例的连续5次成为Top500的冠军。

Cg-4WVWrbD-ILKXyAAJ_MAo4i_oAAHXcwEGA3QAAn9I019.jpg


  不过,高兴之余我们也有一丝隐忧,因为美国商务部在今年4月份发布公告,决定拒绝英特尔公司向中国的国家超级计算中心出售至强芯片用于天河二号的升级。

ChMlWlWrbD-IN868AAKjp0Lm1aMAAHXcwEfh5IAAqO_297.jpg


  因为Xeon E5处理器比较容易获取,所以限售的重点直指Xeon Phi计算加速卡。至于超算为什么必须用加速卡,重点考虑的就是能耗和建设成本。

  限售令公布后,天河2号系统主任设计师、国防科大教授卢宇彤曾回应,“按照原定计划,天河二号拟在今年将计算能力从55PFLOPS升级到100PFLOPS。尽管此次美方对天河二号升级所需Intel Xeon处理器的限售,对原定升级计划有一定影响,但我们早有准备,绝不会影响天河二号从55PFLOPS升级到100PFLOPS的既定目标 。

  至于中国的信心来自那里,本次超算峰会上,卢宇彤的主题演讲也亲自做了回应,我们整理了ZDnet亲临现场后发回的报道,一起来看看。


ChMlWlWrbD-INbn1AAIjoRrWRFkAAHXcwEjSc8AAiO5351.jpg


Cg-4WVWrbD-IXTOIAAI4uWAWHj0AAHXcwElbYgAAjjR965.jpg


  这一次,全新的天河2A首次公开对外公布了信息,和与历代天河系统的对比,其运算峰值将达到100P,更为精彩的是,“中国计算加速卡China Accelerator”首次亮相,型号“Matrix2000”。

ChMlWlWrbECIXWJCAAKBvKaZbH8AAHXcwEnplkAAoHU137.jpg


  虽然处理器方面仍是至强E5-2692 V2,但这款自主的加速卡可谓是对“禁运令”的最大回击。而且,在性能提升到100P的同时,天河2A的功耗几乎没有增加!

  事实上,通用处理器在未来的HPC系统里的权重会越来越低,主要工作将逐渐向控制层面转移,计算任务则主要由加速器完成。因为NVIDIA GPGPU Tesla同样在美国限售范围内,国防科大给出的中国自主研发方案就是通用计算数字信号处理器(GPDSP)。必须承认的是,并不算有多“高大上”。

Cg-4WVWrbECIUNfrAAKfK8P0nP4AAHXcwEqKC0AAp9D625.jpg


  Matrix2000的主要设计规格预计为16核设计,可达到2.4T的浮点性能,虽然还比不上Knight Landing的3T,但对于白手起家的中国来说,已经相当不易,而且功耗比现有的Xeon Phi少了100W。

ChMlWlWrbECILBwxAAJ6o7wtKf4AAHXcwEsx3AAAnq7587.jpg

Matrix2000的内部设计,采用了标量与向量单元+超长指令字(VLIW)的架构


ChMlWlWrbECIVj7iAAIj5vIgBYQAAHXcwEvQisAAiP-936.jpg

针对全新的Matrix2000所准备的软件堆栈,包括GPDPS驱动程序、操作系统、编译器、数学库等


  据国防科大的相关研发人员介绍,有关DSP的浮点计算应用,一直也是国防科大的研发重点,它与超算研究可谓是并行发展。也正是因为有了这样的积累,国防科大才能比较从容的面对美国的限售。但该研发人员也表示,GPDSP的一个推广难点也就在于,在HPC应用领域几乎是从零起步,就像当初NVIDIA刚推出GPGPU时一样,直到CUDA的发布才迅速改善了GPGPU的应用生态环境。

ChMlWlWrbECIZgEAAAKiewh2JN0AAHXcwEx0VQAAqKT282.jpg

Cg-4WVWrbECICYyHAAKggQ8Q1LsAAHXcwE0hdsAAqCZ189.jpg


在互联层,采用了自主研发的TH-Express 2+架构,实现了自适应(Adaptive)互联架构

  所谓的自适应互联架构,就从多个层面入手,通过自应用平台层至底层形成的智能互动,保证网络效率持续而稳定,比如自动规避质量不佳或拥挤的链路,进一步杜绝重复的通信,并在节点与网络故障时对路由重新配置等等。

Cg-4WVWrbECIPcMtAAMIBVAQ2yYAAHXcwE3JnQAAwgd091.jpg

天河二号A仍然是以自主研发的H2FS文件系统为核心,实现了1TB/s的突发传输,100GB/s的持续传输


ChMlWlWrbECIFVVkAALQesUEsGoAAHXcwE6LpEAAtCS297.jpg


  不过卢宇彤表示,目前Matrix2000已经通过了验收。这意味着至少在国防科大的层面,正式投入使用已经没有问题,但具体时间还不能确定,所以只给出了2016年这一较为笼统的时间点。

  相关研发人员也透露,除了应用平台进一步配套完善之外,GPDSP芯片本身的生产与物理设备的调优还有很多工作要做。而且受限于当前中国半导体生产工艺水平,现在还是采用40nm工艺的GPDSP,也在很大程度上制约了Matrix2000的能力。

  总的来说,中国研制超大规模HPC系统的目的肯定不仅仅是为了跑个LINPACK争个名次,否则也不会引起美国的重视并引发限售。

  天河二号A的设计在某种角度上说,真正打开了中国自主HPC发展的向上之路,因为加速器很重要,也因为加速器被国外限售,所以天河二号A在这种环境下还能很快达到100P的性能,也许连美国相关人士也没有想到,但这绝对是件好事!
Be AMDish

190

主题

2094

帖子

2万

积分

铁杆A饭

5820K + Fury X + 追风者 ES515ETG_

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
10779
经验
10
贡献
43
 楼主| 发表于 2015-7-21 10:34:29 | 显示全部楼层
小A快卖皓龙啊
Be AMDish

3330

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
116075
经验
10
贡献
32
发表于 2015-7-21 11:35:58 | 显示全部楼层

你终于把我不转的 发了 可惜你没加点评 小心雷管吓你 明明是快科技的 尽然从ZOL出来 这道绕的

83

主题

520

帖子

1万

积分

Tahiti

Rank: 12Rank: 12Rank: 12

精华
0
金币
11115
经验
10
贡献
5
发表于 2015-7-21 14:59:46 | 显示全部楼层
只禁运了Tesla,AMD的Firepro没禁运,以后买A家的。
ThreadRipper 2950X
256G ECC
Vega FE CF
AX1500i
Intel 750 1.2TB
以上配置不是我的

79

主题

816

帖子

1万

积分

Polaris

Rank: 14Rank: 14Rank: 14Rank: 14

精华
0
金币
13841
经验
10
贡献
0
发表于 2015-7-21 16:20:49 | 显示全部楼层
其实中国缺乏的还是晶圆厂,尤其是先进的晶圆厂。
葵花在手,啊哈哈哈哈哈哈!
江山我有,啊哈哈哈哈哈哈!

2

主题

29

帖子

686

积分

R300

Rank: 3Rank: 3

精华
0
金币
577
经验
10
贡献
0
发表于 2015-7-24 10:05:15 | 显示全部楼层
说实话不看好国产的,PPT吹的飞起,性能实际性能是否如讲的那么好是问题。快点去把AMD收购了……!!

190

主题

2094

帖子

2万

积分

铁杆A饭

5820K + Fury X + 追风者 ES515ETG_

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
10779
经验
10
贡献
43
 楼主| 发表于 2015-7-24 10:07:29 | 显示全部楼层
路人 发表于 2015-7-24 10:05
说实话不看好国产的,PPT吹的飞起,性能实际性能是否如讲的那么好是问题。快点去把AMD收购了……!! ...

Be AMDish

190

主题

2094

帖子

2万

积分

铁杆A饭

5820K + Fury X + 追风者 ES515ETG_

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
10779
经验
10
贡献
43
 楼主| 发表于 2015-7-24 10:08:12 | 显示全部楼层
Phi中国买1391刀一块
美亚批发不到200刀一块,不是坑爹吗
Be AMDish

3330

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
116075
经验
10
贡献
32
发表于 2015-7-24 11:17:47 | 显示全部楼层
z23wen 发表于 2015-7-21 16:20
其实中国缺乏的还是晶圆厂,尤其是先进的晶圆厂。

或许弯道超车 硅晶 差不多了

3330

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
116075
经验
10
贡献
32
发表于 2015-7-24 11:18:32 | 显示全部楼层
路人 发表于 2015-7-24 10:05
说实话不看好国产的,PPT吹的飞起,性能实际性能是否如讲的那么好是问题。快点去把AMD收购了……!! ...

性能只是一方面 能不能软硬结合 未雨绸缪
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表