Dissecando a GTX 1060

Um tempo atrás, a NVIDIA Brasil, nos enviou seu modelo Founders Edition. A sua recém chegada placa para o ramo intermediário de performance conta com um design referência diferenciado em relação às topo de linha. O que já era novidade nas 1080 e 1070, ficou ainda mais diferenciado nas GTX 1060.


O target da placa é entregar uma performance satisfatória com baixo consumo e alta eficiência energética, rodando tranquilamente jogos em 1080p e entregando 1440p às massas.

Mas para sabermos se ela cumpre seu papel, só dissecando a GTX 1060


Em um primeiro olhar, nota-se que conta com um conector de 6 pinos para a fonte, para corresponder aos seus 120W de TDP, sendo 75W advindos do PCI Express e 75W do conector, dando uma folga no projeto.


Pela parte de trás já conseguimos perceber a ausência de backplate, um PCB menor em relação às irmãs maiores e um acabamento estranho para o que sobra do sistema de refrigeração blower.


Sobre o carro chefe da GPU, o GP 106, temos muita coisa o que conversar. O chip manufaturado pela TSMC com projeto de fabricação em 16nm FinFet, para permitir maior eficiência energética e aproveitamento espacial. Em comparação, temos os 28nm das Maxwell contra os 16nm das Pascal GP100, 102 e 104 e 14nm GP 107 (das 1050 e 1050ti). A área útil do chip estudado é de 200mm², e dentro disso temos simplesmente 4,4 bilhões de transistores.

O GP 106, conta com arquitetura Pascal, portanto, sua unidade básica encarregada de todo o multi processamento - o SM - é configurado da seguinte maneira:



São 4 zoneamentos e, cada um, com um Buffer de Instruções, um Agendador de Warps (grupo de 32 threads), duas Dispatch Units, um Register File de 64KB, 32 Cuda Cores, 8 Load/Storage e 8 Unidades de Funções Especiais (SFUs). Esses zoneamentos são cercados por um cache de instruções, um cache de texturas de 48KB, 8 unidades de textura e 96KB de memória compartilhada. Logo, um SM conta com 128 Cuda Cores e 8 Unidades de textura.


Como o GP 106 tem 10 SMs desses que acabamos de demonstrar, temos como resultante o chip completo: Cada SM sendo cercada por uma PolyMorph engine (uma parte da placa que engloba Vertex Fetch, Tesselator, Viewport Transform, Attribute Setup e Stream Output), tudo isso para facilitar a divisão de tarefas dentro do SM e aumentar a eficiência de cada CUDA CORE. Quanto mais PolyMorph Engines, mais capacidade de Tesselation e de calcular Geometria tem a placa. As cinco PolyMorph Engines de cima e as cinco de baixo são ligadas a uma Raster Engine cada que contem (as duas) 48 ROPs, unidades de processamento de Rasterização, que são responsáveis por tornarem o cenário 3D em uma representação bidimensional da geometria que chegará a sua tela: o pixel. Os cinco TPCs mais a Raster Engine formam um GPC que compartilha um cache L2 com o outro GPC, todos cercados por 6 controladores de memória de 32-bit cada em bancos de 1GB GDDR5 de 2000Mhz com 4 palavras por clock (logo, frequência efetiva em 8000Mhz).


Esse emaranhado de engines, cores e caches é regido por um clock base de 1506Mhz e clock Boost 1708Mhz. Contam com o GPU Boost 3.0 que tende a entregar um clock cada vez mais próximo do limite do ASIC. Logo, overclockers de plantão podem se decepcionar com a “falta” de elasticidade do chip. Na realidade, os chips Pascal GP 106 da nossa GTX 1060 - com a ajuda do GPU Boost 3.0 - sai do Boost em 1708Mhz, para 1860Mhz facilmente, deixando para o overclocker uma margem bem menor, já que uma parte considerável da elasticidade do chip foi alcançada pelo software NVIDIA mesmo.


Totalizando tudo: São 1280 Cuda Cores, a 1708Mhz, logo 4,4TFLOPS; 80 TMUs no mesmo clock 136,6 GTexels/s de Texel rate, e 81,98 Gpixels/s de Pixel Rate com seus 48 ROPs. (Lembrando que os números mudariam em base clock).

Logo abaixo você confere a refrigeração por dentro, em cima das bobinas, o Fan Blower, o baseplate e o Vapor Chamber.


De outro ângulo, e mais dissecada, temos os thermalpads para as memórias grudadas no BasePlate.


Note as as configurações das Power Phases em 3+1, suficientes para essa GPU.


Aqui, bancos de memórias ligados ao chip por uma interface de 32-bit para cada banco de 1GB, totalizando 192-bit, 6GB de VRAM, com clock de 8000Mhz e largura de banda de 192GB/s


E por fim, você vê o GP 106, com seu 3,85TFLOPs a 4,37TFLOPs


SISTEMA

Sistema testado foi:

- CPU: Intel Core i7 5930k Stock

- RAM: 16GB DDR4 (4x4) Geil 2400 Mhz

- Placa Mãe: ASUS X99 Strix Gaming 2011v3

- SSD: SAMSUNG EVO 840 256GB (Com Windows 10 64-bit 1607 instalado)

- HDD Seagate Barracuda 3TB - 64MB Cache (com jogo instalado)

- Fonte: Corsair HX 750i

- Refrigeração: Water Cooler Corsair H105i

- AMD Driver: 16.10.2 Crimson

- NVIDIA Driver: 375.63

- Data de coleta dos dados: 1 e 2 de novembro de 2016


PERFORMANCE EM GAMES


PERFORMANCE GERAL

Impressionante como em uma geração, de GTX 960 para GTX 1060, a NVIDIA conseguiu promover um salto de 102,43% de aumento de performance geral. Em comparação à sua rival, o modelo Founders Edition (referência) se sobressai em 13,69% em relação à RX 480 modelo de referência. Se os jogos mais afinados para arquitetura GCN tivessem sido testados, essa diferença poderia ser menor (HITMAN, Ashes of the Singularity e DOOM).

O consumo do sistema inteiro, verificado via Kill-a-Watt na tomada, chega a impressionar. Menos de 200W com a GTX 1060 funcionando em um teste de Stress do 3D Mark. Algo surreal mesmo.

Isso fica mais evidente quando colocamos o salto de Watt/Frame. De 4,7W para cada frame gerado na GTX 960 vs 2,37W gerados por frame na GTX 1060. Dobro de performance, mesmo consumo. Nesse quesito, a NVIDIA vem acertando com grandes avanços. Até a própria RX 480 não consegue ser tão econômica, mesmo com seus 14 nanômetros (3,17W)

Das placas testadas, a única GPU que preocupou foi a RX 480. Isso não é necessariamente um problema do chip, mas da refrigeração do modelo referência. A GTX 1060 não foi as das mais frias, mas ainda é bem melhor que as antigas referências que conseguiam marcas superiores à 80ºC.


CONCLUSÃO


A performance da placa, de maneira geral, permite-nos afirmar que ela consegue seu objetivo, quais sejam, entregar performance superior a 1080p 60FPS, com consumo de energia baixo e eficiente, com tempertatura estável. O preço visto hoje em dia é atrativo e os recursos que o Software e o Hardware da NVIDIA trazem são diferenciais como SMP, Ansel, FastSync, Tiled Based Rasterization e Multi-Res Shading.

O ponto negativo mesmo fica por conta da placa não trazer o SLI. Segundo a NVIDIA, logo logo, vários jogos terão suporte a Explicit Multi Adapter unlinked e linked no DirectX 12 e o SLI (Multi GPU dependente do driver via AFR) não será mais necessário para configurar duas ou mais placas rodando acrescendo performance. A verdade é que desde seu lançamento até o momento, somente Ashes of the Singularity e DEUS EX Mankind Divided apresentaram esse recurso, sendo que neste último, ainda em fase de preview e somente funcionando em AMD. Esperamos que um dia possamos realmente usar duas GTX 1060 para além de dois jogos.