AMD Zen全新架构细节曝光:高度致敬Intel
本帖最后由 冶天 于 2015-8-16 19:26 编辑http://news.mydrivers.com/1/442/442785.htm
AMD将于2016年推出全新的Zen CPU架构。在经历了推土机家族的惨败后,AMD已经在高端市场上萧条了好多年,服务器市场也完全溃败,Zen只许成功不许失败。今天,我们又获得了该架构的一些技术细节,挺有意思的。首先,Zen架构将会支持SMT同步多线程技术,也就是和Intel超线程技术完全相同的那一套,一个物理核心可处理两个逻辑线程。具体的核心、线程调度机制也和Intel的类似,力求做到他山之玉可以攻石。推土机上的“配对核心”设计将被彻底抛弃,回归单个独立核心,尤其是浮点计算单元不再由两个核心共享,而是每个核心一个。不过,三级缓存仍是每两个核心共享一部分。指令集方面,Zen架构将会兼容ISA,也就是Intel Haswell/Broadwell上引入的那些,而且完全兼容现有软件,无需任何编程调整。处理器除了硬件设计,编译器优化也是十分关键的。Zen将会重点优化GCC、LLVM,力争在SPECint v6、Visual Studio等环境中的性能表现媲美Intel。当然啦,AMD也不是完全照抄对手。强大的GPU图形核心、超高带宽的HBM显存,这些都是AMD Zen独有的优势。我们现在还无法预言Zen的理论、实际性能表现,但即便能够做到自己设想中的境界,压力依然很大。Intel更新换代的步伐虽然慢了下来,但多年累积的领先优势实在很大,2016年还会推出第三代14nm Kaby Lake,并且再往后就要上10nm。AMD能做到最好的,就是尽量缩小和对手的性能差距。http://img1.mydrivers.com/img/20150815/s_557d7b48a58647deafc9eaa532452581.jpg
这是个服务器版吧16核的
daokd 发表于 2015-8-15 20:41
这是个服务器版吧16核的
可能 民用要精简一部分内核和HBM 量产小 成本高 合作定制 先优化 再转下来 要是4核8线程的APU也能有两颗HBM2显存,那就爽歪歪了。
据说HBM2单颗带宽可以达到256MB/S,带1536SP都没有问题啊 这标题 2333 什么致敬都是浮云,AMD逆袭指日可待!!! z23wen 发表于 2015-8-15 21:49
要是4核8线程的APU也能有两颗HBM2显存,那就爽歪歪了。
据说HBM2单颗带宽可以达到256MB/S,带1536SP都没有问 ...
那一块APU得多大{:5_162:} 冰夷流云 发表于 2015-8-16 05:30
这标题 2333 什么致敬都是浮云,AMD逆袭指日可待!!!
主要还是务实 部分交叉授权的东西 也只是一方面 重点是编译器两家完整识别 自动定位 更多应用开发有没有使用开源的 大部分都是隔壁和微软的 z23wen 发表于 2015-8-15 21:49
要是4核8线程的APU也能有两颗HBM2显存,那就爽歪歪了。
据说HBM2单颗带宽可以达到256MB/S,带1536SP都没有问 ...
你数据 好像打错了 我看到信息是 每个堆栈的带宽翻番为256GB/s 还的看总线是共享带宽 还是各自独享轮循 但也是显示 看架构将来更多公布 还有桥频率等 还是上次说的 很可能是CPU北桥和GPU的入口 混合的总控 减少了拷贝 直接增加SP计算规模 这是HSA的发展方向 也就是说是入口强化做了一些工作 GCN的SP就专门承担计算 补充:一致性缓存,提升数据调用与共享的速率,提升性能降低功耗 过去,GPU内部核心通信需要程序员或者编译着插入明确的同步指令,来将共享数据送回内存,这种设计虽然简单,但是增加了共享数据和应用程序的开销,效率不高。而GCN架构将打通核心之间的算法沟通,将L2缓存数据格式统一,GPU各核心直接调用其中数据,比显存共享数据更快。http://pub.chinaunix.net/uploadfile/201302/20130225011813690.jpg
▲缓存一致性架构 另外,GCN架构还在CPU与GPU之间引入了虚拟内存,简化了CPU与独显之间的数据移动,CPU与GPU无缝共享一个单一地址空间,共享数据,而不用复制转移。这对于提高效率,降低功耗起到了至关重要的作用。◆高度并行的SIMD,GCN精简架构,提高性能 早起的VLIW受限于编译器的性能,寄存器端口冲突,硬件资源没法充分利用,GCN架构中,采用了性能更高,更简单的矢量寄存器,寄存器文件可以分成独立的四个分区,矢量寄存器(vGPRs)含有64个通道,32bits位宽,相邻组合起来,每个SIMD有vGPRs 64KB分区,这样保证了带宽,消除了端口冲突,这也使得硬件运算资源更加趋于饱和。http://pub.chinaunix.net/uploadfile/201302/20130225011813160.jpg
▲GCN计算单元 两个新的指令:4x1 SAD和Quad SAD,提升GPU相关应用程序性能(比如视频稳定技术SteadyVideo2.0)◆兼具灵活性与可编程性,为加速异构应用带来无限可能 全新架构不仅带来了更强大的运算效率,同时在底层异构运算上也做了巨大的优化,相比过去,GPU已经不仅仅是一个简单的图形中心,GCN架构将使得其具有高度的可编程性,使用更加灵活。AMD积累的CPU与GPU设计经验,将二者优势进一步融合。新产品可以通过DirectCompute、OpenCL、C ++ AMP等关键行业标准访问GPU,进而加速了主流应用程序,最终将实现无缝异构计算。 整体来讲,GCN架构在统一指令流、标量管线调度等功能上,以及真正的工作中提高了GPU利用率,实现更高性能。基于28nm工艺第一代GCN架构GPU,其每瓦性能和每平方毫米性能均比前代产品提升50%!
{:5_138:}反正我要入手860K+370X了 反正以后HSA不一定要APU,也可以是AMD cpu+ AMD GPU z23wen 发表于 2015-8-16 11:05 static/image/common/back.gif
反正以后HSA不一定要APU,也可以是AMD cpu+ AMD GPU
HSA想做大 未来会支持任意架构 这属于一种生态上的模式制定
AMD不是计划明年直接通过GF上14纳米么? 自由的风 发表于 2015-8-16 16:49
AMD不是计划明年直接通过GF上14纳米么?
内容显示是2016 明年 看是先发异架构计算还是民用的 看成品再说,ZEN必须做出来特色,靠玩性价比没有活路 只要制造工艺上去了。。。。其他问题不大 猴年马月才能用上啊,太浮云了{:5_161:}
页:
[1]