ATi RV770 VS NVIDIA GT200
作者:本站 来源:本站整理 发布时间:2008-6-23 6:30:43
AMD的RV670凭借优异的性能和出色的性价比,广受用户欢迎,成为中端显卡的绝对主力,随着AMD下代中高端RV770显示核心的发布,采用RV770 Pro显示核心的显卡6月正式上市,命名为HD 4850,加上后续将上市的RV770XT,RV770系列有望再次延续RV670的经典,成为中高端市场的新贵。与此同时,NVIDlA新的显示核心GT200也将上市,中高端显卡市场硝烟再起。
显示核心再升级
虽然RV670发布时间不长,但其继任者——RV770已经整装待发。RV770显示核心将是AMD下一代主流和性能级图形核心,在RV670的基础上进化而来,AMD下代高端产品也将采用两颗RV670核心组成R780。RV770 Pro仍然采用55nm制程,在规格方面相对RV670有较大的提升,其中最大的升级是流处理器的数量大大提升,由RV670的320个提升至480个,仍然采用16个ROP和256bit显存位宽的组合,而RV770XT的显存位宽则高达512bit。
与RV770的发布时间几乎相同,NVIDIA的GT200显示核心也即将发布。新一代的GT200显示核心仍采用65nm的制造工艺。RV770让NVIDIA加快了GT200的进程,GT200将支持DirectX 10.1,晶体管数将超过10亿。和ATi的路线不同,NVIDIA暂时不会使用GDDR5显存,而是继续使用GDDR3,但会在PCB设计上下工夫,用更高的显存位宽来弥补频率上的劣势。比如用512bit 2.2GHz GDDR3对抗AMD的256bit GDDR5。
制程、功耗——AMD暂时领先
RV770采用了先进的55nm制程,在RV670上已经被应用成熟的55nm制程再次发挥了威力,有助AMD降低显示核心的成本。另外,由于在微架构上进行了更好的优化,因此RV770无论是性能还是功耗都比之前的RV670有明显的进步,按照AMD官方的说法,RV770的功耗在同频下将会有30%左右的降幅,其中RV770 Pro的TDP(设计功耗)为110W。
相对RV770,NVIDIA显示核心晶体管达10亿个以上,如此庞大的晶体管数量虽然采用更高的制造工艺会减小晶圆面积,但是前期产品良品率会大幅度降低,反而不如成熟的65nm,因此NVIDIA仍然继续沿用65nm制程。这也将直接导致GT200的功耗居高不下,GT200显示核心的TDP达到236W,除了PCI-E插槽供电外,还需要一个8pin和一个6pin外接供电,整体功耗十分惊人,需要搭配高端的大功率电源。
规格——各擅胜场
RV770支持DirectX 10.1和Shader Model 4.1,将有RV770Pro和RV770XT两种规格,以显示核心/显存的频率和搭配显存类型的不同来定位。最先上市的将是定位中端的RV770 Pro,搭配GDDR3显存,而RV770XT则将首次搭配GDDR5,上市的时间尚未正式确定,预计在7月发布。
和RV770增加流处理器的做法一样,GT200的每组Shader的流处理单元数也大大增加,从16个提升至24个,顶级型号将包含10组,即高达240个流处理单元,几乎领先目前顶级显示核心G92的128个流处理器近1倍,使得GT200的性能非常值得期待。另外,GT200还拥有32个ROP光栅处理器、80个TMU纹理贴图单元。核心频率将为600MHz,Shader频率则为1300MHz。
性能——均有大幅提升
由于RV770架构进行了优化,流处理器数量增加了50%,并且高端型号RV770XT的显存位宽也增加到512bit,让RV770拥有相当不错的游戏性能。据AMD图形实验室的测试数据,RV770的游戏性能比RV670至少要高出50%~60%,在大多数环境下,RV770能带来平均30%以上的性能提升。
GT200定位高端游戏市场,性能相比G92有大幅提升。流处理器数量比G92增加了112个,显存位宽增加1倍,ROP单元增加1倍,纹理单元增加1.5倍左右,显存频率和带宽提升1倍以上,工作频率和流处理器频率与目前G92持平的情况下性能大致将会提升80%~100%,当然这是理想状态下,实际应用中的性能提升也是相当可观。
架构——NVIDIA更适合游戏
从RV770和GT200的规格来看,在流处理器方面,RV770占据数量上的优势,不过NVIDIA在Shader频率方面更高,这也是因为AMD和NVIDIA在显卡的架构方面采用了不同的处理方式,因此不能单纯根据规格,例如流处理器的数量或者频率来判定显卡的性能。
由于RV770仍然基于R600的架构,GT200也是基于G80架构,因此我们就以R600和G80的架构来说明。G80中集成了128个1D的流处理器,所谓的1D实际上就是指每个流处理器在单个时钟周期内可以同时发射并执行一条指令,并且同时对四个数值进行操作。而R600内实际上拥有64个1D+4D流处理器单元,在最为理想的状况下,每个流处理器都能同时执行五条指令,也就等效于320个1D流处理器的性能。但是,NVIDIA的架构无论处理什么类型的数据,只需简单拆分数据,就可以百分之百地利用流处理器,而ATi的架构则需要去适应数据,对编译器的要求很高,编译器必须尽可能寻找Shader指令中的并行性,将其分配给4D和1D单元(就好像流水线上的工人,将零件按照一个加四个的顺序放上流水线,效率肯定不如一个一个零件依次放上流水线高),并且这种数据拼接并不一定能成功,因此大大影响了流处理的使用效率。
另外,NVIDIA为了弥补流处理器数量的不足,采用了Shader频率和核心频率异步的方式,工作频率一般为核心频率的两倍以上,而ATi则采用同步的方式(直到RV770上才采用了异步),在核心频率相同的情况下,NVIDIA的Shader频率几乎是ATi的两倍,就相当于同频率下的流处理器数量加倍。所以,G80的架构采用完全标量化的计算,资源利用率更高,执行效能也更高。加上较高的Shader频率,执行的效率更高,虽然规格看起来不及ATi,但是在性能方面并不输给R600架构,这就是为什么在游戏中G92显示核心强于RV670的原因,从RV670和G92的对比,我们也可以预料到在RV770和GT200的性能比较中,GT200的性能将更加值得期待。

文章评论 (评论内容只代表网友观点,与本站立场无关!)

您当前的位置: