显卡跟存储合一
曾经看过一篇新闻,不知道是哪家厂商要把存储芯片集成到显卡上。当然对于显卡来说,如果显卡能够直接从硬盘中直接读取数据到显存,下面列下数据的步骤:1,SATA/PCIE,如果显卡需要数据,查询显存,然后查询内存,再读取硬盘,这个步骤的延迟应该比较大;
2, 合一,如果显卡需要数据,查询显存,然后直接读取硬盘,CPU需要数据,查询缓存,再查询内存,最后读取硬盘;
大家来看看,到底利大于弊,还是弊大于利?
本帖最后由 冶天 于 2017-5-24 18:42 编辑
http://news.mydrivers.com/1/492/492850.htm 设计用的 加快某些文件 降低延迟 需要CPU GPU I/O配合 应该是给未来HPC APU等高性能储备的技术 独显可能交换还是滞后高效的SOC 如果是源文件 三角形 几何 纹理 贴图共享 可以直接使用 使用SSD多线程特性 但性能不高 又需要大显存和HBCC进行交换和队列 NCU等 很复杂的设计分工调度 但有条件设计的只有小A一家 显卡自带硬盘好想法 可以的,这个想法很6 看了下,好像是那么回事,看来主要看用途,再决定以哪个为中心。
就现在来讲,大部分还是以CPU为中心,哪怕是游戏,都没办法摆脱CPU。如果有那么一个玩意,AMD的APU如果完全采用支持HSA统一寻址,这个思路很超前,除了游戏主机的定制系统,都还没有支持到这个程度。我画了个差不多的框架,供大家看看
我这个框架,主要是HBM2作为内存主体,另外如果内存不足的话,再插上几条内存作为扩展。
也就是说,HBM2和扩展的内存是作为一个整体,就好比2条内存条一样,HBM2可以从SSD预读取部分数据,扩展内存也会自动从SSD预读取部分数据。而不是HBM2从扩展内存中预读取数据。
而无论CPU还是GPU,需要数据,首先都是从HBM2和扩展内存中读取数据,这个思路,参考了NV的显卡,就是说内存的带宽跟HBM2的带宽是不对等的,而NV的是192位显存,做到了4GB的显存,很明显也是不对等的。
注意了内存是扩展,相当于NV显卡的1GB显存一样。
我记得小R说过 基板衬底做不大 成本太高 良品率不够 并不是内存颗粒也王上面贴,内存条还是单独的插内存条。
APU的规模也不可能太高,除非AMD上次公布的4096SP的超级APU ,TDP 达到200-300W的那种 ,这种应该用也超算的,不过这种规模可能会达到600平方毫米以上。 看过新闻的路过{:6_170:} 这也不是新闻, 这也不是新闻, {:6_232:}有想法
页:
[1]