Websites

Nvidia revela a próxima geração da arquitetura Fermi

Behind the Scenes: Making-of Omniverse Machinima

Behind the Scenes: Making-of Omniverse Machinima
Anonim

Nvidia pode ter renomeado sua NVISION promocional conferência para a "GPU Technology Conference", mas ainda é um show da Nvidia. O CEO Jen-Hsun Huang levou algum tempo durante sua palestra para revelar a próxima grande arquitetura de GPU da empresa, cujo nome de código é "Fermi". Este é o chip gráfico que os fãs têm chamado de GT300, o sucessor de gerações do chip GT200 que alimenta placas como a GeForce GTX 285. O gigante dos chips foi muito cuidadoso ao posicionar o chip como não um novo chip gráfico, mas uma nova "

compute e gráficos" chip, nessa ordem (itálico meu). Na verdade, quase tudo revelado sobre o novo chip está relacionado a seus recursos computacionais, em vez de itens tradicionalmente orientados a gráficos, como unidades de textura e extremidades de renderização. O que sabemos é que o chip é enorme em cerca de 3 bilhões de transistores e será produzido em um processo de 40nm na TSMC. Isso é cerca de 40% mais transistores do que o chip RV870 nas novas placas DirectX 11 da série Radeon 5800, lançadas pela rival AMD. O chip possui 512 unidades de processamento (a Nvidia as chama de núcleos CUDA) organizadas em 16 "multiprocessadores de streaming" de 32 núcleos cada. Isso é mais do que o dobro dos 240 núcleos do GT200, e os núcleos têm aprimoramentos significativos. O chip utilizará uma interface de memória GDDR5 de 384 bits. Aqui estão alguns dos principais pontos:

Multiprocessador de Fluxo de Terceira Geração (SM)

32 núcleos CUDA por SM, 4x mais GT200

  • 8x o pico de desempenho de ponto flutuante de precisão dupla sobre o GT200
  • Dual Warp Scheduler que programa e envia dois warps de 32 threads
  • por clock
  • 64 KB de RAM com um particionamento configurável de memória compartilhada e cache L1
  • Second Geração de segmento paralelo de geração ISA

Espaço de endereço unificado com suporte total a C ++

  • Otimizado para OpenCL e DirectCompute
  • Completo IEEE 754-2008 Precisão de 32 bits e 64 bits
  • Caminho inteiro completo de 32 bits com 64 -bit extensions
  • Instruções de acesso à memória para suportar a transição para o endereçamento de 64 bits
  • Desempenho aprimorado através de predicação
  • Subsistema de memória aprimorado

Hierarquia NVIDIA Parallel DataCache com cachês configuráveis ​​L1 e Unified L2

  • Primeira GPU com suporte de memória ECC
  • Operação de memória atômica aprimorada desempenho
  • NVIDIA GigaThread Engine

Comutação de contexto de aplicativo 10x mais rápida

  • Execução de kernel simultânea
  • Execução de bloco de threads fora de serviço
  • Mecanismos de transferência de memória sobrepostos duplos
  • Há muitos recursos adicionais que devem melhorar o desempenho deste chip em tarefas de computação de fluxo, como taxa de computação de ponto flutuante de precisão dupla muito mais rápida. As GPUs Nvidia atuais calculam a precisão dupla na fração da velocidade das operações de precisão única. Operações de ponto flutuante de precisão dupla agora devem ter metade do desempenho da precisão simples, o que é uma grande melhoria. Grandes melhorias no armazenamento em cache e no agendamento também são aparentes. Você pode ler mais sobre a arquitetura na nova página Fermi da Nvidia, que inclui um whitepaper em PDF.

Então, quando você poderá comprar uma placa gráfica que use este chip? A Nvidia não está dizendo. Representantes da empresa disseram que estão atualmente "trazendo o chip", o que significa que as amostras de trabalho só voltaram recentemente da fábrica de fabricação. Fazendo um palpite do histórico passado, diríamos que dezembro é uma data de lançamento otimista, e o primeiro trimestre de 2010 para maior disponibilidade é mais provável. Espere que as pranchas sejam caras. A Nvidia não divulgará o tamanho do chip, mas a julgar pela contagem de transistores, podemos supor entre 450 e 500 mm

2 . Juntamente com os custos de placa adicionados de uma interface de memória de 384 bits e os desafios de obter bons rendimentos de um chip tão grande no relativamente novo processo de fabricação de 40nm, e você está olhando para cartões que provavelmente serão mais poderosos e mais caro do que as placas recém-lançadas da série Radeon 5800 da AMD. Siga Jason Cross no twitter ou visite seu blog.