全新nVidia G71、G73核心
Geforce 7900GTX/GT & 7600GT登場

文:天晴@"死別"的雪堆中

nVidia將於CeBIT 06大會中發佈全新90奈米的高階G71核心及中階G73核心,究竟它們在規格及效能會否大幅地提升!?我們將分折Geforce 7900GTX、7900GT及7600GT的核心架構,並對比競爭對手及上代產品之間的效能差異。

 

G71 = G70 + 90nm !?

nVidia將會在2006年3月9日於德國CeBIT科技展正式發佈新一代高階G71核心,並命名為Geforce 7900家族。新一代G71核心將會由上代0.11微米改進至90奈米,因此核心時脈有著一定程度的提升空間,或許媒體對G71有著極大的期望,因此在尚未發佈前,各大媒體都預測G71核心的Pixel Shader及Vertex Shader管線數目將會進一步提升,但正式的G71白皮書卻透露,G71和G70的核心架構及規格近乎相同,嚴格來說G71只不過是G70的90奈米版本。

圖上為nVidia Geforce 7900GTX顯示卡,由於PCB設計採用和Geforce 7800GTX 512MB相同的P-348公板12層PCB Layer設計,意味著90奈米的G71核心和0.11微米的G70核心是Pin to Pin兼容的。散熱器方面,Geforce 7900GTX亦用上TM40 公版散熱器,Dual Slot設計銅底鋁鯧片並擁有四支導熱管把熱力由核心加速傳送至散熱器兩端,中央擁有一把7cm的巨型風扇,轉速根據核心溫度由800rpm至2,300rpm自動調節,在最高轉速下其噪音只有37.1dB,效果令人滿意。打破以往的慣例,nVidia並沒有為Geforce 7900GTX設下官方的價格,只向外公佈了建議的價格範圍為499美元至649美之間。

G71的電晶體數目比G70少 !?


G70核心採用0.11微米制程擁有3億2百萬電晶體

G71核心採用90奈米制程擁有2億7千8百萬電晶體
雖然G71和G70的核心架構大致相同,但導入90奈米制程卻令核心時脈得以進一步提升,Geforce 7900GTX由上代550MHz大幅提升至650MHz,而且Vertex Shader引擎時脈非同步運作於700MHz,核心電壓為1.4V,因此在規格沒有大幅變動下效能仍有顯注的提升。90奈米G71的Die Size由於制程進步減少至192平方毫米,因此在同一個圓晶下將可產出更多晶片,有助減低生產成本,如果拿對手同樣是90奈米的R580核心相比,R580 Die Size為352平方毫米差不多是G71的一倍,因此當兩者進行價競爭者時G71將擁有一定的優勢。

G71的架構大致上和G70相同,擁有24條Pixel Shader流水線、8個Vertex Shader引擎及16個ROP,但電晶體數目卻大幅由G70的3億2百萬個減少至2億7千8百萬個,因此不少人都提出疑問究竟nVidia在G71核心中刪除了什麼東西呢?據nVidia Technical Marketing Director -- Nick Stam解釋,G70是一個非常複雜的晶片,而他們亦為了令晶片可運作於預期的工作時脈水平,使用更多空間(增加電晶體使用數)用作迴路上的優化,這方法比單純增加核心的運算管線層數更有效。由於90奈米已給予晶片更高的工作時脈空間,因此nVidia在G71中減少了用作迴路上優化的空間(減少電晶體使用數目),進一步降低成本,所以G71並沒有因為電晶體的減少,而刪走了任何G70既有的功能。

相反G71還有在細微的部份作出了微調,例如上代G70核心的SLi AA是透過PCI-E的頻寬作轉輸,而G71則改上MIO接口減少了PCI-E頻寬的使用,另外ROP部份亦作出了改良令Blending運算時效能有作提升。上代G70雖支援Dual-Link DVI,但核心內部只擁有一組Dual-Link DVI Transmitter,G71則內建兩組Dual-Link DVI Transmitters而無需外接Transmitter晶片。

G71也有48 Pixel Shader Processor

早前ATi發佈了新一代Radeon X1900XTX,其R580核心採用了16條Pixel Shader流水線但卻擁有48個Pixel Shader Processor(ALU)的1:3架構,據ATi表示由於大部份遊戲都偏重使用Arithmetic Operation數學性運算,單純以數學公式進行演算渲染,因此R580只單純提升基於R520的Pixel Shader ALU數目以提升Arithmetic Operqations的能力,這是最節省成本而且有明顯的效果。

但其實nVidia早已採用以上架構,早在Geforce 6系統中nVidia的單一Pixel Shader流水線內就擁有兩個Pixel Shader ALU,這亦是為何在同一時脈下ATi的GPU核心運算能力不及nVidia,不過Geforce 6 其中一組ALU的運算能力並不完整,只能運算4個MULs指令,因此每一組Pixel Shader流水線最高只能同時運算4個MADD指令及4個MULs指令(MADD指令是包含MUL及ADD Ops),但Geforce 7系列的流水線其Pixel Shader ALU指令則可同時組算最高8個MADD指令,故此實際上nVidia很早就便已提供48個Pixel Shader Processor的GPU了。

採用Samsung -1.1ns 16Mx32顆粒

記憶體方面,Geforce 7900GTX採用上8顆Samsung -1.1ns 16Mx32顆粒,記憶體頻寬為256Bit,合共記憶體容量為512MB,據nVidia表示Geforce 7900GTX將不會推出256MB版本,預設時脈為1.6GHz相比上代Geforce 7800GTX 512MB版本較低。

Geforce 7800GTX 512MB
Geforce 7900GTX
ATi Radeon X1900XTX
Core Code
G70
G71
R580
Process Technology
110nm TSMC
90nm TSMC
90nm TSMC
No. of Transistors
302M
278M
384M
Core Clock (VS/Core MHz)
550/550
700/650
650
Memory Clock
1.7GHz
1.6GHz
1.55Hz
Pixel Shader
24
24
16
Vertex Shader
8
8
8
ROPs
16
16
16
ALU
48
48
48
Memory Interface
256Bit
256Bit
256Bit
Frame Buffer Size
512MB
512MB
512MB
Memory Bandwidth
54.4
51.2
49.6
Vertices/s
1100M
1400M
1300M
Pixel Fill Rate
8.8Billion/s
10.4 Billion/s
10.4Billion/s
Texture Fill Rate
13.2 Billion/s
15.6 Billion/s
10.4Billion/s
 
Geforce 7900GT同時登場

除了GTX版本,nVidia亦同時發佈採用G71核心的Geforce 7900 GT版本,和7800GT不同之處在於核心並沒有被屏敝任何部份,包括Pixel Shader流水線及Vertex Shader引擎,因此7900GT和GTX版本只有時脈上的差別,Geforce 7900GTX採用上成本較便宜的P-455公板8層PCB Layer,由於90奈米令晶片功耗下降,因此Geforce 7900GT亦只用上一把較細少的TM34E全銅散熱器,已足夠應付運作時產生的熱力。nVidia同樣沒有為Geforce 7900GT定下官方售價,只提供了一個較闊鬆的建議售價,由$249美元至399美元。

GT︰與GTX只存在時脈上的差別

Geforce 7900GTX同樣建有24條Pixel Shader流水線、8個Vertex Shader引擎、16個ROPs及48個ALU,核心時脈為450MHz相比Geforce 7800GTX的430MHz還要高,而Vertex Shader時脈亦比核心時脈較高達到470MH,GT版本的G71核心工作電壓較GTX版本為低由1.4V減至1.2V。採用90奈米的7900GT時脈設定其實十分保守,因此保留了大幅度的超頻空間給用家,筆者在沒有修改電壓及改用散熱器下,單純用nVidia Forceware驅動程式自動偵測最佳化設定,核心可以穩定地超頻583MHz的水平,令效能直迫Geforce 7800GTX 512MB,因此Geforce 7900GT可以說是nVidia高階顯示系統中最高性價比的一員。

記憶體方面,Geforce 7900GT亦改用了136Pin Samsubg -1.4ns GDDR3 8Mx32記憶體顆粒,記憶體頻寬同樣為256Bit,預設時脈為1.32GHz,由於-1.4ns GDDR3顆粒規格上官方規格可運作於1.4GHz,因此Geforce 7900GT的記憶體部份同樣保留了一定幅度的超頻能力。

 
Geforce 7800GTX 256MB
Geforce 7900GT
Geforce 7800GT
Core Code
G70
G71
G70
Process Technology
110nm TSMC
90nm TSMC
110nm TSMC
No. of Transistors
302M
278M
302M
Core Clock (VS/Core MHz)
470/430
470/450
440/400
Memory Clock
1.2GHz
1.32GHz
1GHz
Pixel Shader
24
24
20
Vertex Shader
8
8
7
ROPs
16
16
16
ALU
48
48
40
Memory Interface
256Bit
256Bit
256Bit
Frame Buffer Size
256MB
256MB
256MB
Memory Bandwidth
38.4
42.2
32
Vertices/s
940M
940M
770M
Pixel Fill Rate
6.88 Billion/s
7.2 Billion/s
6.4 Billion/s
Texture Fill Rate
10.32 Billion/s
10.8 Billion/s
8.0 Billion/s
新一代中階核心 : G73

由於上代NV43核心擁有超高性價比的表現,對ATi的中階產品造成極大的壓力,因此廠商和用家亦對G73能否延續NV43的高性價比特性抱很大的期望,G73核心設計是基計G71的簡化版本,採用90奈米制程由TSMC代工,核心內建的Pixel Shader流水線由NV43的8條提升至12條, Vertex Shader引擎則由上代只有3個提升至5個,ROP數目由4個提升至8個,因此G73在規格上與上代NV43有很大幅度的提升。

如果對比對手ATi RV530中階核心,G73規格更是拋離甚遠,其實RV530是一個只有4條Pixel Shader流水線的核心,但採用類似高階R580的1:3架構,擁有12個ALU,因此初期不少用家甚至媒體都會誤以為是12條Pixel Shader流水線架構。跟所有Geforce 7家族架構相同,G73核心是採用1:2的架構即擁有24個ALU。

由於G73核心採用新一代CineFX 4.0 3D引擎在Pipeline架構擁有嶄新的設計,例如重新設計Vertex Shader引擎以減少執行及設定幾何運算所需要時間,在單週期MADD運算比上代NV43提高20-30%,Geometry運算能力的效率比上代提升30%以上、全新的Pixel Shader引擎能執行兩倍以上浮點運算工作及大幅度加強數學算運,其4FP Ops per Pixel Shader Unit可以運算8個FP MADDs/Pixel(included MUL及ADD ops)、以及加入了64Bit Texture Unit能體現新硬體的演算能力,更準確預計運算並加速Filtering及Blending等工作,因此Shader運算能力將比NV43提高約一倍。

而且新加入反鋸齒技術,G73核心提升至IntelliSample 4.0版本,除了提升至16X Anisotropic Filtering達128 Taps採樣外,更加了兩種全新的反鋸齒模式,TSAA (透明動態超級採樣)及TMAA(透明動態多採樣),舊有的反鋸齒技術無法對幼長的物件如柵欄、樹葉、植物等物品於Direct3D下產生作用,但新的TSAA及TMAA模式則能解決以上問題,這亦是上代NV43所不能比擬。

nVidia Geforce 7600GT

nVidia G73核心被命名為Geforce 7600家族,首張推出的型號為Geforce 7600GT, 據知nVidia還會在中月發佈Geforce 7600GS,另外G73核心亦會像NV43一樣,屏敝部份流水線進入低階市場,據廠商表示Geforce 7300GT極有可能採用G73核心。Geforce 7600GT採用P456 六層PCB Layer設計,其最高功耗只有43W,因此並不需要使用6Pin PCI-E電源接口,散熱器方面採用和Geforce 7900GT相同的TM34E公板設計,官方建議售價為199美元至249美元之間。

圖下為G73晶片的真身,雖然規格比上代大幅提高,但由於改進至90奈米令G73的Die Size和NV43相約,內建1億7千7百萬電晶體,相比ATi的RV530核心超頻2億電晶體成本更低。Geforce 7600GT核心時脈為560MHz,核心電壓為1.3V,我們以自動偵測核心最佳時脈設定為610MHz,表現令人滿意。

採用GDDR3 -1.4ns GDDR3記憶體

G73核心保持最高支持128Bit記憶體頻寬,而Geforce 7600GT則用上Samsung -1.4ns GDDR3 16Mx32記憶體顆粒,預設時脈為1.4GHz和記憶體官方規格相同,因此7600GT記憶體超頻表現只是一般。

Geforce 6600GT
Geforce 7600GT
Radeon X1600XT
Core Code
NV43
G73
RV530
Process Technology
110nm TSMC
90nm TSMC
90nm TSMC
No. of Transistors
110M
177M
210M
Core Clock (VS/Core MHz)
500
560
590
Memory Clock
1GHz
1.4GHz
1.38GHz
Pixel Shader
8
12
4
Vertex Shader
3
5
4
ROPs
4
8
4
ALU
8
24
12
Memory Interface
128Bit
128Bit
128Bit
Memory Bandwidth
4.8
6.72
6.624
Vertices/s
375M
700M
590M
Pixel Fill Rate
2.0 Billion/s
4.48 Billion/s
2.36 Billion/s
Texture Fill Rate
4.0 Billion/s
7.2 Billion/s
2.36 Billion/s
測試平台︰
AMD Athloin 64 FX-60 2.6GHz Socket 939 (Dual Core)
MSI K8N-Diamond-Plus (nForce 4 SLi X16)
DFI LanParty CFX3200 (Xpress 3200)
Geil DDR 400 512MB x 2 (CL 2-2-2-5)
Asus Geforce 7800GTX 512MB (550MHz/1.7GHz)
HIS Radeon X1900XTX 512MB (650MHz/1.55GHz)
HIS Radeon X1900XT CrossFire (625MHZ/1.45GHz)
HIS Radeon X1800XT 512MB (650MHz/1.55GHz)
ATi Catalyst Version 6.2 Driver
nVidia Forceware 84.17 Driver

 

Geforce 7900GTX VS Radeon X1900XTX

7800GTX
550MHz/1700MHz
7900GTX
650MHz/ 1600MHz
1900XTX
650MHz/1550MHz
3DMark 03
 
 
1024 x 768
20424
22151
18906
1280 x 1024
16554
17895
15627
1600 x 1200
13084
14902
13040
1600 x 1200 4AA
9013
9498
9279
3DMark 05
 
 
 
1024 x 768
9754
10902
11689
1280 x 1024
8434
9597
10643
1600 x 1200
7565
8350
9517
1600 x 1200 4AA
6417
7070
8257
3DMark 06
 
 
 
1024 x 768
6133
6979
6733
SM2.0
2562
2964
2637
HDR
2760
3057
3310
1280 x 1024
5174
6065
5911
SM2.0
2148
2507
2324
HDR
2163
2449
2602
1600 x 1200
4364
5238
5166
SM2.0
1814
2122
2064
HDR
1755
2024
2120
1600 x 1200 4AA
-
-
4206
SM2.0
1321
1751
1731
HDR
-
1516
1580
Doom 3
 
 
 
1600 x 1200 4AA 8AF
70.3
83.7
79.9
Half-Life 2
 
 
1600 x 1200 4AA 8AF
73.09
95.31
92.24
BattleFiled 2 v1.2
 
 
 
1600 x 1200 4AA 8AF
56.24
63.51
71.17
Serious Sam 2
 
 
 
1600 x 1200 4AA 8AF
55.2
61.3
57.3
Splinter Cell CT
 
 
1600 x 1200 4AA 8AF
58.6
66.3
65.6
FEAR
 
 
 
1600 x 1200 4AA 8AF
48.7
56.1
65.6
Geforce 7900GTX SLi VS Radeon X1900XT CrossFire
7800GTX SLi
550MHz/1700MHz
7900GTX SLi
650MHz/ 1600MHz
1900XT CrossFire
625MHz/1450MHz
3DMark 03
 
 
1024 x 768
32823
34380
29886
1280 x 1024
27354
38484
24827
1600 x 1200
23113
24381
20441
1600 x 1200 4AA
15964
16278
13882
3DMark 05
 
 
1024 x 768
13626
13878
14335
1280 x 1024
13074
13247
13747
1600 x 1200
12356
12607
13176
1600 x 1200 4AA
11376
11576
12461
3DMark 06
 
1024 x 768
8623
9395
9356
SM2.0
4141
4462
4184
HDR
4332
4418
4788
1280 x 1024
8053
8843
8752
SM2.0
3901
4211
3903
HDR
3856
3813
4271
1600 x 1200
7212
7996
7984
SM2.0
3435
3841
3601
HDR
3218
3206
3622
1600 x 1200 4AA
-
-
6619
SM2.0
2891
3119
3053
HDR
-
-
2616
Doom 3
 
 
 
1600 x 1200 4AA 8AF
124.4
130.3
118.0
Half-Life 2
 
 
1600 x 1200 4AA 8AF
123.54
136.33
131.22
BattleFiled 2 v1.2
 
 
 
1600 x 1200 4AA 8AF
102.24
112.14
121.17
Serious Sam 2
 
 
 
1600 x 1200 4AA 8AF
89.2
114.3
96.3
Splinter Cell CT
 
 
1600 x 1200 4AA 8AF
103.7
110.2
112.4
FEAR
 
 
 
1600 x 1200 4AA 8AF
74.7