Apostilas Processadores CORE.pdf
Apostilas Processadores CORE.pdf
Apostilas Processadores CORE.pdf
- No tags were found...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
3<br />
Duo Core<br />
Autor:<br />
Luciano Pinheiro dos Santos
4<br />
História do Core Duo<br />
A idéia de processamento duplo adota-se já faz tempo. Esse emprego é mais<br />
perceptível nos computadores de grande porte, servidores ou estações de trabalho,<br />
mais conhecido como Mainframes, onde se trabalha com dois ou mais<br />
processadores acoplado em uma placa mãe. O interessante a ser frisado é que<br />
esses processadores são alocados em soquetes diferentes na placa e não em uma<br />
mesma pastilha, como realizado nos modelos duais atuais.<br />
Antigamente uma das principais preocupações dos fabricantes desses<br />
produtos era com a velocidade (freqüência do clock) de processamento. Mas os<br />
mesmos perceberam que essa busca poderia sim ser alcançada, contudo este<br />
processo resultaria em um consumo de energia muito alto e em conseqüência<br />
também uma dissipação alarmante de calor. Para um consumidor utilitário de<br />
desktop ficaria inviável a refrigeração desse processador, além do custo final ficar<br />
bastante elevado.<br />
Deixando o raciocínio de elevar o clock, a lógica agora é duplo<br />
processamento e redução de energia. Esta técnica consiste em acoplar dois<br />
processadores em uma mesma pastilha. Estes trabalharam ao mesmo tempo para a<br />
realização da mesma tarefa, logo esse trabalho será concluído bem mais rápido que<br />
apenas um processador. Este ganho de performance é melhor visualizado ao se<br />
trabalhar com com várias tarefas.<br />
Pensando desta forma os dois principais fabricantes desses componentes,<br />
Intel e AMD, lançaram seus produtos com essa tecnologia. Os primeiros<br />
lançamentos da intel baseado nessa tecnologia foi o Pentium D e o Pentium<br />
Extreme Edition, ocorrido em 2005. Ambos são baseados em uma tecnologia de<br />
núcleo denominada de NetBurst, a qual foi herdada do Pentium 4, ela tem o objetivo<br />
de proporcionar maior freqüência de clock. A principal diferença entre os dois é que<br />
o segundo além de ter dois núcleos, possui também a tecnologia Hyper Treading<br />
armazenada nesses núcleos, esta se comporta como dois processadores reais, mas<br />
no entanto, são processadores virtuais. Portanto o Sistema operacional irá<br />
reconhecê-lo como quatro processadores. Em 2006 a Intel lança novos<br />
processadores: o Core 2 Duo, o Core 2 Quad e o Core 2 Extreme, estes por sua vez<br />
são baseados em uma nova tecnologia criada pela mesma e batizada de Core. Esta,
5<br />
agora, visa redução do consumo de energia concomitante a um maior poder de<br />
processamento. Esta tecnologia permite desativar parte do processador que não<br />
esta sendo utilizado, desta forma usa somente o potencial necessário a realização<br />
da tarefa.<br />
O período de lançamento dos processadores duais da AMD foi também em<br />
2005. Esses modelos foram o Opteron e o Athlon X2, o primeiro é pra servidor e o<br />
segundo para desktop. A AMD também pensa em projetar outros processadores,<br />
agora com quatro núcleos. Nesta nova proposta será implantado duas pastilhas em<br />
socketes diferentes, sendo que cada pastilha conterá dois processadores, assim<br />
totalizando quatro processadores. Logo o ganho de desempenho deste será bem<br />
acentuado.<br />
De acordo com as informações colhidas, observa-se que esses<br />
processadores é tão recente que não há muita história a ser contada. O que<br />
percebe-se, na verdade, é um constante aparecimento de novos modelos de<br />
processadores, tanto pelo lado da Intel quanto da AMD, com características<br />
diferentes e muito mais poderosos que os anteriores, contribuindo assim para que<br />
possamos adquirir produtos excelentes a preços acessíveis. O modelo Core 2 Duo<br />
é atualmente ,segundo avaliações feitas por instituições competentes no assunto, o<br />
mais poderoso, entretanto os da AMD é também espetacular e a um custo mais<br />
baixo, portanto a depender da finalidade destinada a segunda opção pode ser mais<br />
indicada, onde a relação custo benefício é requerida.<br />
<strong>Processadores</strong> de Duplo Núcleo da Intel<br />
Pentium 4<br />
Diante de tantos aplicativos e softwares cada vez mais exigentes, a Intel viuse<br />
em uma determinada situação em que trabalhar com processadores de núcleo<br />
único já não era mais tão eficaz quanto ela imaginava. Devido a isso, no final de<br />
2003 (Q4 período em que a Intel divide como sendo seu último trimestre), a Intel<br />
lançou o Pentium 4 baseado na arquitetura NetBurst, era um processador voltado<br />
para aplicações de alto nível e com um rendimento muito bom, trabalhava com
6<br />
instruções MMX, SSE, SSE2, e SSE3. Nessa versão de processador a Intel<br />
simulava um núcleo duplo a partir da tecnologia Hyper Treading, que visava dividir o<br />
processador em dois processadores lógicos . Contudo a Intel, não estava mais<br />
conseguindo aliar o clock, ficando com ele até algo mais de 3.8Ghz e um pipeline<br />
de 31 estágios. Além de ter havido problemas, pois acima desse clock, a eletricidade<br />
perdida pelos transistores do processador, era alta tornando assim o Pentium 4, um<br />
processador com o consumo e dissipação térmica altas demais.<br />
Pentium D<br />
No início de 2004 (Q1), surgiu o Pentium D, processador dual core para<br />
notebooks, que começou a se utilizar de 90 nm. O Pentium D, trabalha com<br />
instruções MMX, SSE, SSE2 , SSE3 e EM64T, além de se utilizar de uma tecnologia<br />
similar a usada no Pentium III, onde gerencia a energia de modo ao processador só<br />
usá-la quando necessário. E passou a se destacar dos outros processadores, devido<br />
ao fato de trabalhar com 2 MB de cache L2, tem o processamento basicamente<br />
comparado a dois Pentium 4, trabalhando simultaneamente. Os processadores Dual<br />
Core da Intel, melhoram bastante ao executar várias tarefas simultaneamente, já<br />
que os processos podem ser divididos entre os dois core, demonstrando assim um<br />
desempenho muito superior ao do Pentium 4.<br />
Core 2 Duo<br />
Em meados de 2006 (Q3), surge talvez o melhor processador do mundo, o<br />
Core 2 Duo e o Core 2 Duo Extreme, a partir desse momento o Pentium 4, se torna<br />
parte do passado. Dando lugar aos processadores com 2 ou 4 núcleos unificados<br />
trabalhando em apenas 10 ciclos contra os 14 do Pentium D.<br />
O Core 2 Duo, passa a trabalhar com as Instruções MMX, SSE, SSE2, SSE3,<br />
SSE4 e EM64T. Através de diversas técnicas de miniaturização, o Core 2 Duo,<br />
passa a trabalhar com 65 nm. Além de possuir barramentos superiores a 800 Mhz,<br />
alguns chegam até 1066 MHz o que possibilita até 4 transferências de 266 Mhz po
7<br />
ciclo). O cache L1 do Core 2 Duo ou Conroe nome genérico usado pela Intel,<br />
trabalha com 8 linhas de associação, contra apenas 2 do seu concorrente direto.<br />
Isso possibilita um cache mais eficiente, aumentando a probabilidade da informação<br />
ser encontrada. O cache L2 que pode chegar até 4 Mb, é acessado através de um<br />
barramento de dados de 256 bits. E uma das novidades mais significativas do Core<br />
2 Duo é o Macro-Fusion, que permite diversos pares de instruções comuns<br />
combinados em uma única instrução, ao invés de serem processados<br />
individualmente. Isso gera um efeito benéfico ao processador que economiza<br />
espaço nos buffers de memória, economiza processamento no agendador de<br />
instruções ou scheduler e assim por diante, causando até 11% de ganho bruto a<br />
nível de desempenho se comparado a um de seus antecessores o Pentium 4.<br />
O grande forte do Core 2 Duo está na decodificação das instruções pois,<br />
processa as instruções SSE de 128 bits em apenas um ciclo o que causa grande<br />
agilidade.<br />
Quad Core<br />
Com o lançamento da mais nova plataforma de sistema operacional da<br />
Microsoft o Windows Visa no final de 2006 (Q4 para a Intel), a Intel lançou um<br />
processador que seria o melhor para tal sistema. Assim surge no mercado o Intel<br />
Quad Core, que possui as mesmas características que o Core 2 Duo, porém possui<br />
ao invés de 2 núcleos, 4 e somente em versões com 4 Mb de cache L2, o que o<br />
torna o mais rápido do mercado ao lado do Core 2 Duo Extreme.<br />
Quad 2 Duo e tendências futuras<br />
Já em Janeiro de 2007 (Q1), a Intel fez o lançamento do Core 2 Quad com<br />
cerca de 45 nm, a nova geração de processadores dessa linha, terá um consumo de<br />
energia ainda menor, onde a Intel busca viabilizar o lançamento de versões ainda<br />
mais velozes e com maior poder de processamento. Para o final de 2007 (Q4), a
8<br />
Intel, faz uma previsão de estar trabalhando com uma técnica de miniaturização<br />
ainda melhor, vislumbrando alcançar 35 nm.<br />
AMD<br />
Athlon 64 X2<br />
A AMD foi a primeira empresa a lançar processadores de núcleo duplo com<br />
arquitetura de 64 bits, baseado na arquitetura IBM PC x86. Ela utiliza tecnologia<br />
própria para a comunicação entre o processador e os outros dispositivos de entrada<br />
e saída de memória o “Direct Connect Arquitecture” que permite conexão<br />
independente para cada núcleo.<br />
Com dois núcleos o computador trabalha como se houvesse dois<br />
processadores independentes. Apenas sistemas operacionais com suporte a SMP<br />
(Suporte ao Multiprocessamento Simétrico) são capazes de utilizar e perceber o<br />
aumento do poder de processamento proporcionado por esta arquitetura.<br />
Uma das principais características dos processadores de núcleo duplo da AMD é a<br />
comunicação entre os núcleos que se dá através de um barramento embutido no<br />
processador, chamado de HyperTransport, permitindo-o atingir velocidades maiores<br />
nesta comunicação. Outros fabricantes utilizam a ponte norte que esta fora do<br />
processador para esta comunicação, o que em teoria diminuiria a velocidade de<br />
comunicação entre os núcleos.<br />
A tecnologia de núcleo duplo do processador Athlon 64 X2 tem por base a<br />
utilização de um processador com dois núcleos, cada núcleo idêntico ao Athlon 64,<br />
ou seja, cada núcleo tem sua arquitetura baseada em um Athlon 64.<br />
Plataforma Quad FX<br />
A AMD lançou a plataforma Quad FX que utiliza dois soquetes na mesma<br />
placa mãe trazendo para o pc o que já era comum nos servidores. Através da<br />
arquitetura de Conexão Direta de Soquete Duplo (DSDC) que se dá a comunicação
9<br />
dos dois processadores de duplo núcleo, facilitando o trabalho em paralelo. O<br />
barramento HyperTransport coerente conecta os dois processadores desta<br />
plataforma. Esta plataforma exige que o processador possua dois barramentos<br />
HyperTransport, como já foi dito um conecta os dois processadores enquanto o<br />
outro barramento cuida da conexão com o chipset, vale ressaltar que há dois chip<br />
sets, um para cada soquete.<br />
Esta plataforma utiliza dois processadores Athlon 64 FX de soquete F (1.027<br />
pinos) este suporta as instruções MMX, 3Dnow!, SSE e SSE2. Alem disto nota-se<br />
também que o controle da memória é embutido no processador e a memória é<br />
acessada por um barramento exclusivo facilitando a transferência de dados entre os<br />
dois.<br />
Como podemos perceber a AMD utilizou tal recurso, pois ainda não dispõe de<br />
tecnologia para implementação de quatro núcleos em uma única pastilha, mas tendo<br />
em vista tal objetivo, esta plataforma poderá estar sendo condicionada a utilização<br />
de processadores com tal capacidade, que transporia a esta plataforma ao trabalho<br />
de oito núcleos trabalhando em paralelo.<br />
Processador sun Niagara<br />
Objetivo da empresa sun, é transformar processadores com maior<br />
performance e menos custo de energia. Utilizando uma postura agressiva multi<br />
cores, cada um capaz de executar quatro theadrs aplicando uma tecnologia CMT,<br />
também adotar arquitetura UltraSPARC que economiza recursos menos necessários<br />
compartilhando apenas uma unidade de ponto flutuantes entre todos as cores e<br />
enfatiza fatores importantes para gerar um alto throughtup,como 4 unidades de<br />
controle de memória DDR2 integrado.<br />
O processador Sun Niagara ou UltraSPARC T1,é um processador que visa<br />
atuar em servidores workload, como webservers e datacenters. Este tipo de<br />
processador possui 8 tipos de cores de processamento que (são comercializado<br />
versões de 4 a 6 cores). Onde cada um executa quatro theadrsde hardware<br />
utilizando 32 theadrs.
10<br />
A idéia do professor Kule Olukotun foi desenvolver processadores hydra CMP<br />
(Multiprocessing). Pois a empresa afara websystems não pode continuar com seu<br />
projeto por quer faltou caixa para manter, daí foi vendida em 2002 para SUM<br />
MICROSYSTEMS onde o projeto foi na base Niagara.<br />
A empresa Niagara tem objetivo de fazer processadores com altos valores de<br />
performance em quanto mantem valores de energia razoáveis. A media de consumo<br />
é 72W chegando até o pico de 79W. Tendo a sua arquitetura simples, com várias<br />
cores de baixa freqüência, mas alto throughtup é o principal fator disso.<br />
Entretanto o Niagara tem a suas limitações também, a sua limitação mais seria é o<br />
fator de possuir apenas uma unidade de ponto flutuante (FPU) apenas 8 cores, e<br />
assim é incapaz de processar mais que 1- 3% do ponto flutuantes.<br />
CMT<br />
Chipe-level multithreading é uma combinação de chip-level<br />
multiprocessing(CMT) que processa diversas cores em um chip só. A vertical<br />
multithreading (VMT) apenas umas das theadrs de cada cores para executar<br />
instruções em um ciclo, trocando para outro thead quanto a thead ativa buscar<br />
dados da memoria. Este tipo de técnica é utilizada pela sun, para minimizar a<br />
eficiência de cada cores.<br />
Todas as cores possui papiline de seis estágios, com instruções da cache L1,<br />
uma data cache L1 é uma unidade de gerenciamento de memória que são<br />
compartilhado pela 4 theadrs e todas as cores são ligada pela cache L2 , que é<br />
compartilhado por todos. assim o sistema operacional enxergar 32 processamentos<br />
virtuais.<br />
Formatos de dados<br />
A arquitetura UltraSPARC reconhece os seguintes tipos de dados inteiros,<br />
com sinal ( 8,16,32 e 64 bits),SIMD (UNIT 8 de 32bits, int 16 de 64 bits,int 32 de 64<br />
bits) e ponto flutuantes (32,64,e 128 bits). Acompanha esse tipo de dados os
11<br />
seguintes comprimentos de palavras Byte(8 bits), meia – palavra (16 bits), a palavra<br />
marcada ( valor de 30 bits e 2 bits de marcação), palavra dupla ex tendida(64bits) e<br />
palavra quádrupla (128 bits).<br />
Os inteiros com sinal são sinal completamente de dois, enquanto os inteiros sem<br />
sinal são escritos usando – se toda sua extensão. Palavra Marcada Têm a marcação<br />
de dois bits menos significativos Flutuantes tem sua representação normal (IEEE std<br />
754 - 1985), alterando apenas expoente ({7;0}, {10;0} e {14;0}) e frações<br />
({22;0},{52;32} + {31;0} e {111;96} + {95;64}<br />
+ {63;32} + {31;0}), respectivamente para 32 ,64 , 128 bits de representação, cm<br />
todas um bit sinal.<br />
Memória<br />
Com capacidade par executar theads simultaneamente, uma interface rápida de<br />
acesso a memoria é extremamente importante para Niagara. Para suprir a alta<br />
demanda de dados, o processador conta com quatro controladores de memoria<br />
DDR2 integrado. A integrar o controlador de memoria com o processador, fazemos<br />
com que ele funcione na mesma frequência do processador. Recebendo<br />
informações da memoria muito mais rápida.<br />
Cache<br />
Um dos principais limitadores a velocidade de processamento é o tempo de<br />
latência das memórias, que é o tempo despendido desde a solicitação de dados pelo<br />
processador até o recebimento dos mesmos. Para diminuir os efeitos deste<br />
problema existem os cache: memória pequena e rápida, em um nível mais próximo<br />
ao processador, que servem para armazenar os dados e instruções com maior<br />
probabilidade de serem solicitados pelo processador.<br />
Cada core do processador Sun Niagara possui um L1 de 24KB, dividido em um<br />
cache de instruções de 16 KB, com bloco de 32 B e um cache de dados de 8 KB,
12<br />
com blocos de 16B, ambos four-way set associativa, com bloco de 64B, que é<br />
compartilhado entre os 8 cores. Para manter a coerência de cache, é utilizada a<br />
técnica de write – through.<br />
Tendências evolutivas dos processadores: o que as empresas<br />
planejam<br />
O aumento de velocidade na freqüência de execuções atribuídas ao<br />
processador medida em gigahertz, esta se tornando defasada, dando lugar à<br />
multiplicação dos núcleos de processamento. Obter dois núcleos não significa ter o<br />
dobro de poder de processamento, mas permite utilizar várias tarefas ao mesmo<br />
tempo com grande desempenho. Buscar um maior poder de processamento,<br />
estabelecendo técnicas de aumento da freqüência e de números de transistores são<br />
técnicas usadas nos processadores de único núcleo. Daí surge um problema, o<br />
aquecimento do processador e o gerenciamento de energia.<br />
A Intel utilizou em seu processador Dual Core uma tecnologia que são usadas<br />
cinco portas de envio, pela qual são enviadas três microinstruções para unidade de<br />
execução por pulso de clock, uma nova tendência da Intel é o uso real de 128 bits<br />
no caminho de dados, nos processadores anteriores era de 64 bits, isto significa um<br />
maior poder de processamento para manipulação de dados de 128 bits.<br />
A AMD criou uma tecnologia chamada de HyperTranport que é uma<br />
arquitetura de conexão direta com a memória principal, tendo um controlador de<br />
memória DDR integrado facilitando o acesso rápido pelo processador. A arquitetura<br />
de 64 bits interage com qualquer software, facilitando as aplicações de 64 bits, tanto<br />
as aplicações de 32 quanto os de 64 bits são executadas de forma simultânea na<br />
mesma plataforma.<br />
O processador da AMD de duplo núcleo é diferente da arquitetura da Intel, os<br />
processadores Athlon 64 e Opteron a ponte norte do chipset esta integrada dentro<br />
do próprio processador, permitindo ao processador a troca de informações entre si<br />
de forma paralela. Na arquitetura da Intel se um dos núcleos precisa enviar dados<br />
para outro núcleo inicia-se um processo em que, ele tem que pedir permissão à
13<br />
ponte norte, que esta localizada fora do processador, tendo como conseqüência o<br />
acesso a uma velocidade menor.<br />
Recursos e benefícios<br />
A partir dos detalhes evidenciados acerca dos processadores de duplonúcleo,<br />
faz-se necessário um benchmark (comparação) entre essas CPU,<br />
destacando algumas vantagens (e desvantagens) de um processador de dois ou<br />
mais núcleos. Então, temos que o multiprocessamento é uma idéia antiga - afinal,<br />
diz um velho ditado que "duas cabeças pensam melhor do que uma" -, mas a<br />
criação de chips com múltiplos núcleos reflete a dificuldade de se aumentar ainda<br />
mais a velocidade do processador sem implementar rebuscados (e caros) artifícios<br />
para controlar o superaquecimento.<br />
Em vista disso, a Intel cancelou o lançamento do Pentium 4 de 4GHz<br />
(“Prescott”) e partiu para a linha Pentium D - e, mais adiante, para o Core2Duo. Em<br />
linhas gerais, essa solução consiste em obter mais poder de processamento sem<br />
elevar a freqüência de operação, investindo na distribuição das tarefas por dois<br />
núcleos encapsulados numa mesma pastilha de silício.<br />
Chips com dois ou mais núcleos (porque os quad-core não tardam a chegar)<br />
apresentam algumas diferenças em relação aos da tecnologia anterior, sendo a<br />
primeira delas nominal: a indicação de velocidade baseada em GHz deixa de fazer<br />
sentido, porque os dois núcleos operam geralmente na mesma velocidade - mas seu<br />
trabalho conjunto, combinado com o cache compartilhado, os torna mais eficientes<br />
(enquanto um núcleo grava um CD, por exemplo, o outro pode rodar um game, com<br />
comunicação total entre eles, ou edição de um vídeo, etc.). Isso sem mencionar que<br />
o ganho não se limita apenas ao processamento: a interação entre os núcleos<br />
consome menos energia, diminui a quantidade de calor dissipado e abre um leque<br />
de soluções para os problemas que impediam o avanço dos microprocessadores: o<br />
superaquecimento. Ao dividir tarefas com os dois núcleos, o processador produz o<br />
calor padrão do seu clock (2,16 GHz, por exemplo) sem avançar na sua curva<br />
geométrica de aquecimento.
14<br />
Tudo indica que esse tipo de CPU deverá integrar a maioria dos desktops e<br />
servidores a ser fabricado ao longo dos próximos anos. Nesse aspecto, um fator que<br />
pode ser encarado como uma desvantagem é o custo alto para o consumidor final<br />
destes produtos, que ainda estão em fase de desenvolvimento e disseminação no<br />
mercado. E como deverá se tornar padrão (tanto para Intel quanto para AMD), essa<br />
inovação acabará forçando os fabricantes a queimar seus estoques de chips<br />
convencionais, visando preparar o mercado para a popularização das novas linhas<br />
Core 2 Duo e Athlon X2.<br />
Vale lembrar que o pleno aproveitamento dos chips de múltiplos núcleos<br />
requer adequações em nível de software - a menos que os sistemas e aplicativos<br />
sejam reescritos, os benefícios não são tão representativos assim. Se por exemplo,<br />
tratarmos de um usuário que utiliza softwares “comuns” como um editor de textos,<br />
uma planilha de dados, etc., o desempenho pode não ser tão evidenciado quanto<br />
para outro usuário que trabalhe com edição de imagens ou jogos.<br />
Outros fabricantes para montagem de servidores<br />
Power6<br />
A IBM lançou o processador Power6 para ser utilizado em servidores, é um<br />
processador com 2 a 16 núcleos nas velocidades 3,50, 4,20 ou 4,70GHz. Essa<br />
freqüência de clock é mais que o dobro da do Power5, o antecessor do novo chip. É,<br />
também, mil vezes a freqüência de clock do primeiro IBM PC, lançado em 1981.<br />
Aquele PC pioneiro rodava a 4,77 MHz. Além do clock mais rápido, o Power6 tem<br />
cache interno de 8 MB, quatro vezes o do Power5. O Power6 possui um barramento<br />
de dados ultra-rápido, o processador troca dados com a placa-mãe a uma<br />
velocidade de até 300 GB/s.<br />
Um servidor System p570 construído com esse chip já bateu 25 recordes de<br />
desempenho. A empresa diz, ainda, que o novo processador, mesmo rodando a 4,7<br />
GHz, consome a mesma quantidade de energia que o Power5 a 2,2 GHz.<br />
Adicionalmente, o chip permite desacelerar o clock para poupar energia. O Power6<br />
compete com os processadores da Sun e da Intel. Os concorrentes, porém,
15<br />
concentraram-se em aumentar o número de núcleos. A Sun tem processadores<br />
UltraSPARC T1 de 8 núcleos; e a Intel deve lançar o seu Xeon de 8 núcleos no<br />
segundo semestre. A IBM, ao contrário, acelerou o clock e a transferência de dados,<br />
mas manteve apenas dois núcleos no chip.