AMD Zen全新架构细节曝光：高度致敬Intel

冶天发表于 2015-8-15 20:36:21

本帖最后由冶天于 2015-8-16 19:26 编辑

http://news.mydrivers.com/1/442/442785.htm
AMD将于2016年推出全新的Zen CPU架构。在经历了推土机家族的惨败后，AMD已经在高端市场上萧条了好多年，服务器市场也完全溃败，Zen只许成功不许失败。今天，我们又获得了该架构的一些技术细节，挺有意思的。首先，Zen架构将会支持SMT同步多线程技术，也就是和Intel超线程技术完全相同的那一套，一个物理核心可处理两个逻辑线程。具体的核心、线程调度机制也和Intel的类似，力求做到他山之玉可以攻石。推土机上的“配对核心”设计将被彻底抛弃，回归单个独立核心，尤其是浮点计算单元不再由两个核心共享，而是每个核心一个。不过，三级缓存仍是每两个核心共享一部分。指令集方面，Zen架构将会兼容ISA，也就是Intel Haswell/Broadwell上引入的那些，而且完全兼容现有软件，无需任何编程调整。处理器除了硬件设计，编译器优化也是十分关键的。Zen将会重点优化GCC、LLVM，力争在SPECint v6、Visual Studio等环境中的性能表现媲美Intel。当然啦，AMD也不是完全照抄对手。强大的GPU图形核心、超高带宽的HBM显存，这些都是AMD Zen独有的优势。我们现在还无法预言Zen的理论、实际性能表现，但即便能够做到自己设想中的境界，压力依然很大。Intel更新换代的步伐虽然慢了下来，但多年累积的领先优势实在很大，2016年还会推出第三代14nm Kaby Lake，并且再往后就要上10nm。AMD能做到最好的，就是尽量缩小和对手的性能差距。http://img1.mydrivers.com/img/20150815/s_557d7b48a58647deafc9eaa532452581.jpg

daokd 发表于 2015-8-15 20:41:08

这是个服务器版吧16核的

冶天发表于 2015-8-15 20:50:55

daokd 发表于 2015-8-15 20:41
这是个服务器版吧16核的

可能民用要精简一部分内核和HBM 量产小成本高合作定制先优化再转下来

z23wen 发表于 2015-8-15 21:49:41

要是4核8线程的APU也能有两颗HBM2显存，那就爽歪歪了。
据说HBM2单颗带宽可以达到256MB/S,带1536SP都没有问题啊

冰夷流云 发表于 2015-8-16 05:30:46

这标题 2333 什么致敬都是浮云，AMD逆袭指日可待！！！

Mil_Paso 发表于 2015-8-16 08:35:52

z23wen 发表于 2015-8-15 21:49
要是4核8线程的APU也能有两颗HBM2显存，那就爽歪歪了。
据说HBM2单颗带宽可以达到256MB/S,带1536SP都没有问 ...

那一块APU得多大{:5_162:}

冶天发表于 2015-8-16 08:36:37

冰夷流云发表于 2015-8-16 05:30
这标题 2333 什么致敬都是浮云，AMD逆袭指日可待！！！

主要还是务实部分交叉授权的东西也只是一方面重点是编译器两家完整识别自动定位更多应用开发有没有使用开源的大部分都是隔壁和微软的

冶天发表于 2015-8-16 08:46:42

z23wen 发表于 2015-8-15 21:49
要是4核8线程的APU也能有两颗HBM2显存，那就爽歪歪了。
据说HBM2单颗带宽可以达到256MB/S,带1536SP都没有问 ...

你数据好像打错了我看到信息是每个堆栈的带宽翻番为256GB/s 还的看总线是共享带宽还是各自独享轮循但也是显示看架构将来更多公布还有桥频率等还是上次说的很可能是CPU北桥和GPU的入口混合的总控减少了拷贝直接增加SP计算规模这是HSA的发展方向也就是说是入口强化做了一些工作 GCN的SP就专门承担计算

冶天发表于 2015-8-16 08:51:13

补充:一致性缓存，提升数据调用与共享的速率，提升性能降低功耗　　过去，GPU内部核心通信需要程序员或者编译着插入明确的同步指令，来将共享数据送回内存，这种设计虽然简单，但是增加了共享数据和应用程序的开销，效率不高。而GCN架构将打通核心之间的算法沟通，将L2缓存数据格式统一，GPU各核心直接调用其中数据，比显存共享数据更快。http://pub.chinaunix.net/uploadfile/201302/20130225011813690.jpg
▲缓存一致性架构　　另外，GCN架构还在CPU与GPU之间引入了虚拟内存，简化了CPU与独显之间的数据移动，CPU与GPU无缝共享一个单一地址空间，共享数据，而不用复制转移。这对于提高效率，降低功耗起到了至关重要的作用。◆高度并行的SIMD，GCN精简架构，提高性能　　早起的VLIW受限于编译器的性能，寄存器端口冲突，硬件资源没法充分利用，GCN架构中，采用了性能更高，更简单的矢量寄存器，寄存器文件可以分成独立的四个分区，矢量寄存器(vGPRs)含有64个通道，32bits位宽，相邻组合起来，每个SIMD有vGPRs 64KB分区，这样保证了带宽，消除了端口冲突，这也使得硬件运算资源更加趋于饱和。http://pub.chinaunix.net/uploadfile/201302/20130225011813160.jpg
▲GCN计算单元　　两个新的指令：4x1 SAD和Quad SAD，提升GPU相关应用程序性能(比如视频稳定技术SteadyVideo2.0)◆兼具灵活性与可编程性，为加速异构应用带来无限可能　　全新架构不仅带来了更强大的运算效率，同时在底层异构运算上也做了巨大的优化，相比过去，GPU已经不仅仅是一个简单的图形中心，GCN架构将使得其具有高度的可编程性，使用更加灵活。AMD积累的CPU与GPU设计经验，将二者优势进一步融合。新产品可以通过DirectCompute、OpenCL、C ++ AMP等关键行业标准访问GPU，进而加速了主流应用程序，最终将实现无缝异构计算。　　整体来讲，GCN架构在统一指令流、标量管线调度等功能上，以及真正的工作中提高了GPU利用率，实现更高性能。基于28nm工艺第一代GCN架构GPU，其每瓦性能和每平方毫米性能均比前代产品提升50%！

純禽小畜男 发表于 2015-8-16 10:44:59

{:5_138:}反正我要入手860K+370X了

z23wen 发表于 2015-8-16 11:05:25

反正以后HSA不一定要APU，也可以是AMD cpu+ AMD GPU

冶天发表于 2015-8-16 11:46:13

z23wen 发表于 2015-8-16 11:05 static/image/common/back.gif
反正以后HSA不一定要APU，也可以是AMD cpu+ AMD GPU

HSA想做大未来会支持任意架构这属于一种生态上的模式制定

自由的风 发表于 2015-8-16 16:49:33

AMD不是计划明年直接通过GF上14纳米么？

冶天发表于 2015-8-16 16:55:01

自由的风发表于 2015-8-16 16:49
AMD不是计划明年直接通过GF上14纳米么？

内容显示是2016 明年看是先发异架构计算还是民用的

Mcisu萌 发表于 2015-8-16 21:31:55

看成品再说，ZEN必须做出来特色，靠玩性价比没有活路

lzw2012 发表于 2015-8-23 11:49:46

只要制造工艺上去了。。。。其他问题不大

夕阳沙士 发表于 2015-9-6 11:15:39

猴年马月才能用上啊，太浮云了{:5_161:}

页: [1]

Red Team 红色小队论坛's Archiver

AMD Zen全新架构细节曝光：高度致敬Intel