sexta-feira, 24 de fevereiro de 2012

AMD Hammer - Os recursos

Um recurso de destaque no Hammer é a inclusão do controlador de memória dentro do próprio processador. Isto aumenta um pouco o número de transístores e o custo, mas por outro lado traz algumas vantagens interessantes.

No design convencional, onde o controlador de memória faz parte do chipset da placa mãe, os sinais saem do processador, fazem uma escala no chipset e só depois chegam à memória RAM. O mesmo acontece nas operações de leitura.

No Hammer o sinal ainda precisa passar pelo controlador de memória, mas em compensação, o controlador opera na mesma frequência que o restante do processador, e não na mesma frequência que a placa mãe, como actualmente. Isso resulta em tempos de acessos mais baixos e um ganho considerável de desempenho.
O controlador de memória do Hammer utilizará memórias DDR, com suporte tanto a acessos a 64 bits (como na maioria dos sistemas actuais), quanto ao acesso a 128 bits (como no chipset nForce da nVidia), uma opção que ficará à cargo do projectista da placa mãe. A AMD divulgou também que o Hammer suportará o uso de um controlador de memória externo, caso seja necessário adicionar suporte à outra tecnologia de memória (Rambus por exemplo) ou caso alguém consiga desenvolver um controlador superior (improvável, mas possível).

Outra novidade importante é o suporte para as instruções SSE 2, suportadas pelo Pentium 4. Os processadores derivados do core Palomino (Athlon XP, Duron Morgan, etc.) já trazem suporte às instruções SSE do Pentium III, um conjunto muito mais limitado do que o implantado no Pentium 4. Como em última análise o concorrente directo do Hammer será justamente o Pentium 4, as novas instruções permitirão ao processador lutar em igualdades de condições, já que cada vez mais programas são optimizados para este conjunto de instruções.

Um detalhe interessante é que apesar do bom desempenho prometido, o Hammer não deverá ser capaz de operar a frequências de operação muito superiores aos Athlons de 0.13 mícron que serão produzidos na mesma época que ele. Isso demonstra que a AMD não pretende seguir o caminho da Intel com o Pentium 4, adicionando mais estágios de pipeline e outros recursos para permitir que o processador seja capaz de operar a frequências mais altas, mesmo que o desempenho não cresça na mesma proporção.

O Hammer terá 12 estágios de pipeline, contra 10 estágios do Athlon actual, 10 estágios do Pentium III e 20 estágios do Pentium 4. A grosso modo, existe uma relação directa entre o número de estágios de pipeline e a frequência de operação que o processador será capaz de atingir, Em compensação, existe também uma grande perda de desempenho por clock ao utilizar muitos estágios de pipeline. É por isso que um Pentium 4 de 2.0 GHz perde para um Athlon XP de 1533 MHz na maioria das aplicações, como comentei a pouco.
Para reforçar esta tese, vale citar exemplos como o do Alpha 21264A, que mesmo operando a apenas 666 MHz, é capaz de superar um Athlon de 1.2 GHz em aplicações utilizadas em servidores, ou mesmo o Itanium, que na sua versão original opera a apenas 800 MHz, mas é capaz de apresentar um desempenho semelhante ao dos processadores Pentium 4 de 1.6 ou até mesmo 1.8 GHz.

A resposta para esta conta que não fecha está no facto do Hammer ter simplesmente o dobro de unidades de execução. São 6 unidades para inteiros, 6 unidades para leitura e gravação e mais 6 unidades para o coprocessador aritmético, 18 no total.

Isso já é o suficiente para concluir que o Hammer consumirá algo próximo do dobro da electricidade de um Athlon da mesma frequência. Isso é muita coisa. Fazendo um cálculo aproximado, um Hammer de 3.0 GHz, produzido numa arquitectura de 0.13 mícron com o uso de SOI (silicon on insulator, uma tecnologia desenvolvida pela IBM que diminui o consumo eléctrico do processador e permite que ele seja capaz de operar a frequências mais altas) consumirá algo entre 200 e 220 Watts. É muito, considerando que será um processador destinado também ao mercado doméstico.

Mas, voltando ao requisito desempenho, o facto de dobrar o número de unidades de execução não significa que um Hammer será duas vezes mais rápido que um Athlon da mesma frequência. Parte do ganho será perdido por causa do aumento no número de estágios de pipeline e outra grande parte se perderá em ciclos ociosos do processador.

Considerando que a grande maioria dos programas são compilados para funcionar em processadores capazes de executar uma única instrução por vez, é muito complicado manter 18 unidades de execução trabalhando o tempo todo. Isso já é uma missão impossível no Athlon, que tem metade disso...

Haverá um ganho de desempenho expressivo sem dúvidas, mas não deverá ser algo superior a 30 ou 40% na maioria das aplicações, mesmo considerando o controlador de memória mais rápido.

Considerando o enorme consumo eléctrico e o preço do processador, que provavelmente será bem mais alto que o Athlon, provavelmente não será uma boa ideia pensar em adquirir um logo no lançamento.
 
Mais duas características que não poderia deixar de comentar é o cache e o suporte a multiprocessamento. A AMD divulgou que existirão versões do Hammer com até 1 MB de cache L2.

Isso me leva a crer que provavelmente a versão destinada a servidores (que vem sendo provisoriamente chamada de SledgeHammer) virá com 1 MB de cache, enquanto a versão destinada ao mercado doméstico (o ClawHammer) virá com apenas 512 ou mesmo 256 KB. Claro que isso é apenas suposição.

O cache L1 por sua vez continua sendo o mesmo usado no Athlon, com 128 KB no total, mas dividido em dois blocos de 64 KB, para dados e instruções.
 
Finalmente, o Hammer trará também um suporte de multiprocessamento bastante aperfeiçoado. Como cada processador têm seu próprio controlador de memória, cada um terá os seus próprios módulos de memória RAM, em comparação com os actuais, onde o mesmo barramento com a memória é dividido entre todos os processadores. Isso trará claro um grande ganho de performance nos servidores onde são utilizados 4 ou 8 processadores, apesar de não representar muito para os utilizadores domésticos.

O Hammer trará suporte para um número muito grande de processadores, mas provavelmente este recurso só virá habilitado na versão para servidores. A versão doméstica deverá ser limitada a apenas dois processadores.
in Manual de Hardware Completo
de Carlos E Marimoto

Sem comentários: