Apostilas Processadores CORE.pdf

3 

Duo Core 

Autor: 

Luciano Pinheiro dos Santos

4 

História do Core Duo 

A idéia de processamento duplo adota-se já faz tempo. Esse emprego é mais 

perceptível nos computadores de grande porte, servidores ou estações de trabalho, 

mais conhecido como Mainframes, onde se trabalha com dois ou mais 

processadores acoplado em uma placa mãe. O interessante a ser frisado é que 

esses processadores são alocados em soquetes diferentes na placa e não em uma 

mesma pastilha, como realizado nos modelos duais atuais. 

Antigamente uma das principais preocupações dos fabricantes desses 

produtos era com a velocidade (freqüência do clock) de processamento. Mas os 

mesmos perceberam que essa busca poderia sim ser alcançada, contudo este 

processo resultaria em um consumo de energia muito alto e em conseqüência 

também uma dissipação alarmante de calor. Para um consumidor utilitário de 

desktop ficaria inviável a refrigeração desse processador, além do custo final ficar 

bastante elevado. 

Deixando o raciocínio de elevar o clock, a lógica agora é duplo 

processamento e redução de energia. Esta técnica consiste em acoplar dois 

processadores em uma mesma pastilha. Estes trabalharam ao mesmo tempo para a 

realização da mesma tarefa, logo esse trabalho será concluído bem mais rápido que 

apenas um processador. Este ganho de performance é melhor visualizado ao se 

trabalhar com com várias tarefas. 

Pensando desta forma os dois principais fabricantes desses componentes, 

Intel e AMD, lançaram seus produtos com essa tecnologia. Os primeiros 

lançamentos da intel baseado nessa tecnologia foi o Pentium D e o Pentium 

Extreme Edition, ocorrido em 2005. Ambos são baseados em uma tecnologia de 

núcleo denominada de NetBurst, a qual foi herdada do Pentium 4, ela tem o objetivo 

de proporcionar maior freqüência de clock. A principal diferença entre os dois é que 

o segundo além de ter dois núcleos, possui também a tecnologia Hyper Treading 

armazenada nesses núcleos, esta se comporta como dois processadores reais, mas 

no entanto, são processadores virtuais. Portanto o Sistema operacional irá 

reconhecê-lo como quatro processadores. Em 2006 a Intel lança novos 

processadores: o Core 2 Duo, o Core 2 Quad e o Core 2 Extreme, estes por sua vez 

são baseados em uma nova tecnologia criada pela mesma e batizada de Core. Esta,

5 

agora, visa redução do consumo de energia concomitante a um maior poder de 

processamento. Esta tecnologia permite desativar parte do processador que não 

esta sendo utilizado, desta forma usa somente o potencial necessário a realização 

da tarefa. 

O período de lançamento dos processadores duais da AMD foi também em 

2005. Esses modelos foram o Opteron e o Athlon X2, o primeiro é pra servidor e o 

segundo para desktop. A AMD também pensa em projetar outros processadores, 

agora com quatro núcleos. Nesta nova proposta será implantado duas pastilhas em 

socketes diferentes, sendo que cada pastilha conterá dois processadores, assim 

totalizando quatro processadores. Logo o ganho de desempenho deste será bem 

acentuado. 

De acordo com as informações colhidas, observa-se que esses 

processadores é tão recente que não há muita história a ser contada. O que 

percebe-se, na verdade, é um constante aparecimento de novos modelos de 

processadores, tanto pelo lado da Intel quanto da AMD, com características 

diferentes e muito mais poderosos que os anteriores, contribuindo assim para que 

possamos adquirir produtos excelentes a preços acessíveis. O modelo Core 2 Duo 

é atualmente ,segundo avaliações feitas por instituições competentes no assunto, o 

mais poderoso, entretanto os da AMD é também espetacular e a um custo mais 

baixo, portanto a depender da finalidade destinada a segunda opção pode ser mais 

indicada, onde a relação custo benefício é requerida. 

Processadores de Duplo Núcleo da Intel 

Pentium 4 

Diante de tantos aplicativos e softwares cada vez mais exigentes, a Intel viuse 

em uma determinada situação em que trabalhar com processadores de núcleo 

único já não era mais tão eficaz quanto ela imaginava. Devido a isso, no final de 

2003 (Q4 período em que a Intel divide como sendo seu último trimestre), a Intel 

lançou o Pentium 4 baseado na arquitetura NetBurst, era um processador voltado 

para aplicações de alto nível e com um rendimento muito bom, trabalhava com

6 

instruções MMX, SSE, SSE2, e SSE3. Nessa versão de processador a Intel 

simulava um núcleo duplo a partir da tecnologia Hyper Treading, que visava dividir o 

processador em dois processadores lógicos . Contudo a Intel, não estava mais 

conseguindo aliar o clock, ficando com ele até algo mais de 3.8Ghz e um pipeline 

de 31 estágios. Além de ter havido problemas, pois acima desse clock, a eletricidade 

perdida pelos transistores do processador, era alta tornando assim o Pentium 4, um 

processador com o consumo e dissipação térmica altas demais. 

Pentium D 

No início de 2004 (Q1), surgiu o Pentium D, processador dual core para 

notebooks, que começou a se utilizar de 90 nm. O Pentium D, trabalha com 

instruções MMX, SSE, SSE2 , SSE3 e EM64T, além de se utilizar de uma tecnologia 

similar a usada no Pentium III, onde gerencia a energia de modo ao processador só 

usá-la quando necessário. E passou a se destacar dos outros processadores, devido 

ao fato de trabalhar com 2 MB de cache L2, tem o processamento basicamente 

comparado a dois Pentium 4, trabalhando simultaneamente. Os processadores Dual 

Core da Intel, melhoram bastante ao executar várias tarefas simultaneamente, já 

que os processos podem ser divididos entre os dois core, demonstrando assim um 

desempenho muito superior ao do Pentium 4. 

Core 2 Duo 

Em meados de 2006 (Q3), surge talvez o melhor processador do mundo, o 

Core 2 Duo e o Core 2 Duo Extreme, a partir desse momento o Pentium 4, se torna 

parte do passado. Dando lugar aos processadores com 2 ou 4 núcleos unificados 

trabalhando em apenas 10 ciclos contra os 14 do Pentium D. 

O Core 2 Duo, passa a trabalhar com as Instruções MMX, SSE, SSE2, SSE3, 

SSE4 e EM64T. Através de diversas técnicas de miniaturização, o Core 2 Duo, 

passa a trabalhar com 65 nm. Além de possuir barramentos superiores a 800 Mhz, 

alguns chegam até 1066 MHz o que possibilita até 4 transferências de 266 Mhz po

7 

ciclo). O cache L1 do Core 2 Duo ou Conroe nome genérico usado pela Intel, 

trabalha com 8 linhas de associação, contra apenas 2 do seu concorrente direto. 

Isso possibilita um cache mais eficiente, aumentando a probabilidade da informação 

ser encontrada. O cache L2 que pode chegar até 4 Mb, é acessado através de um 

barramento de dados de 256 bits. E uma das novidades mais significativas do Core 

2 Duo é o Macro-Fusion, que permite diversos pares de instruções comuns 

combinados em uma única instrução, ao invés de serem processados 

individualmente. Isso gera um efeito benéfico ao processador que economiza 

espaço nos buffers de memória, economiza processamento no agendador de 

instruções ou scheduler e assim por diante, causando até 11% de ganho bruto a 

nível de desempenho se comparado a um de seus antecessores o Pentium 4. 

O grande forte do Core 2 Duo está na decodificação das instruções pois, 

processa as instruções SSE de 128 bits em apenas um ciclo o que causa grande 

agilidade. 

Quad Core 

Com o lançamento da mais nova plataforma de sistema operacional da 

Microsoft o Windows Visa no final de 2006 (Q4 para a Intel), a Intel lançou um 

processador que seria o melhor para tal sistema. Assim surge no mercado o Intel 

Quad Core, que possui as mesmas características que o Core 2 Duo, porém possui 

ao invés de 2 núcleos, 4 e somente em versões com 4 Mb de cache L2, o que o 

torna o mais rápido do mercado ao lado do Core 2 Duo Extreme. 

Quad 2 Duo e tendências futuras 

Já em Janeiro de 2007 (Q1), a Intel fez o lançamento do Core 2 Quad com 

cerca de 45 nm, a nova geração de processadores dessa linha, terá um consumo de 

energia ainda menor, onde a Intel busca viabilizar o lançamento de versões ainda 

mais velozes e com maior poder de processamento. Para o final de 2007 (Q4), a

8 

Intel, faz uma previsão de estar trabalhando com uma técnica de miniaturização 

ainda melhor, vislumbrando alcançar 35 nm. 

AMD 

Athlon 64 X2 

A AMD foi a primeira empresa a lançar processadores de núcleo duplo com 

arquitetura de 64 bits, baseado na arquitetura IBM PC x86. Ela utiliza tecnologia 

própria para a comunicação entre o processador e os outros dispositivos de entrada 

e saída de memória o “Direct Connect Arquitecture” que permite conexão 

independente para cada núcleo. 

Com dois núcleos o computador trabalha como se houvesse dois 

processadores independentes. Apenas sistemas operacionais com suporte a SMP 

(Suporte ao Multiprocessamento Simétrico) são capazes de utilizar e perceber o 

aumento do poder de processamento proporcionado por esta arquitetura. 

Uma das principais características dos processadores de núcleo duplo da AMD é a 

comunicação entre os núcleos que se dá através de um barramento embutido no 

processador, chamado de HyperTransport, permitindo-o atingir velocidades maiores 

nesta comunicação. Outros fabricantes utilizam a ponte norte que esta fora do 

processador para esta comunicação, o que em teoria diminuiria a velocidade de 

comunicação entre os núcleos. 

A tecnologia de núcleo duplo do processador Athlon 64 X2 tem por base a 

utilização de um processador com dois núcleos, cada núcleo idêntico ao Athlon 64, 

ou seja, cada núcleo tem sua arquitetura baseada em um Athlon 64. 

Plataforma Quad FX 

A AMD lançou a plataforma Quad FX que utiliza dois soquetes na mesma 

placa mãe trazendo para o pc o que já era comum nos servidores. Através da 

arquitetura de Conexão Direta de Soquete Duplo (DSDC) que se dá a comunicação

9 

dos dois processadores de duplo núcleo, facilitando o trabalho em paralelo. O 

barramento HyperTransport coerente conecta os dois processadores desta 

plataforma. Esta plataforma exige que o processador possua dois barramentos 

HyperTransport, como já foi dito um conecta os dois processadores enquanto o 

outro barramento cuida da conexão com o chipset, vale ressaltar que há dois chip 

sets, um para cada soquete. 

Esta plataforma utiliza dois processadores Athlon 64 FX de soquete F (1.027 

pinos) este suporta as instruções MMX, 3Dnow!, SSE e SSE2. Alem disto nota-se 

também que o controle da memória é embutido no processador e a memória é 

acessada por um barramento exclusivo facilitando a transferência de dados entre os 

dois. 

Como podemos perceber a AMD utilizou tal recurso, pois ainda não dispõe de 

tecnologia para implementação de quatro núcleos em uma única pastilha, mas tendo 

em vista tal objetivo, esta plataforma poderá estar sendo condicionada a utilização 

de processadores com tal capacidade, que transporia a esta plataforma ao trabalho 

de oito núcleos trabalhando em paralelo. 

Processador sun Niagara 

Objetivo da empresa sun, é transformar processadores com maior 

performance e menos custo de energia. Utilizando uma postura agressiva multi 

cores, cada um capaz de executar quatro theadrs aplicando uma tecnologia CMT, 

também adotar arquitetura UltraSPARC que economiza recursos menos necessários 

compartilhando apenas uma unidade de ponto flutuantes entre todos as cores e 

enfatiza fatores importantes para gerar um alto throughtup,como 4 unidades de 

controle de memória DDR2 integrado. 

O processador Sun Niagara ou UltraSPARC T1,é um processador que visa 

atuar em servidores workload, como webservers e datacenters. Este tipo de 

processador possui 8 tipos de cores de processamento que (são comercializado 

versões de 4 a 6 cores). Onde cada um executa quatro theadrsde hardware 

utilizando 32 theadrs.

10 

A idéia do professor Kule Olukotun foi desenvolver processadores hydra CMP 

(Multiprocessing). Pois a empresa afara websystems não pode continuar com seu 

projeto por quer faltou caixa para manter, daí foi vendida em 2002 para SUM 

MICROSYSTEMS onde o projeto foi na base Niagara. 

A empresa Niagara tem objetivo de fazer processadores com altos valores de 

performance em quanto mantem valores de energia razoáveis. A media de consumo 

é 72W chegando até o pico de 79W. Tendo a sua arquitetura simples, com várias 

cores de baixa freqüência, mas alto throughtup é o principal fator disso. 

Entretanto o Niagara tem a suas limitações também, a sua limitação mais seria é o 

fator de possuir apenas uma unidade de ponto flutuante (FPU) apenas 8 cores, e 

assim é incapaz de processar mais que 1- 3% do ponto flutuantes. 

CMT 

Chipe-level multithreading é uma combinação de chip-level 

multiprocessing(CMT) que processa diversas cores em um chip só. A vertical 

multithreading (VMT) apenas umas das theadrs de cada cores para executar 

instruções em um ciclo, trocando para outro thead quanto a thead ativa buscar 

dados da memoria. Este tipo de técnica é utilizada pela sun, para minimizar a 

eficiência de cada cores. 

Todas as cores possui papiline de seis estágios, com instruções da cache L1, 

uma data cache L1 é uma unidade de gerenciamento de memória que são 

compartilhado pela 4 theadrs e todas as cores são ligada pela cache L2 , que é 

compartilhado por todos. assim o sistema operacional enxergar 32 processamentos 

virtuais. 

Formatos de dados 

A arquitetura UltraSPARC reconhece os seguintes tipos de dados inteiros, 

com sinal ( 8,16,32 e 64 bits),SIMD (UNIT 8 de 32bits, int 16 de 64 bits,int 32 de 64 

bits) e ponto flutuantes (32,64,e 128 bits). Acompanha esse tipo de dados os

11 

seguintes comprimentos de palavras Byte(8 bits), meia – palavra (16 bits), a palavra 

marcada ( valor de 30 bits e 2 bits de marcação), palavra dupla ex tendida(64bits) e 

palavra quádrupla (128 bits). 

Os inteiros com sinal são sinal completamente de dois, enquanto os inteiros sem 

sinal são escritos usando – se toda sua extensão. Palavra Marcada Têm a marcação 

de dois bits menos significativos Flutuantes tem sua representação normal (IEEE std 

754 - 1985), alterando apenas expoente ({7;0}, {10;0} e {14;0}) e frações 

({22;0},{52;32} + {31;0} e {111;96} + {95;64} 

+ {63;32} + {31;0}), respectivamente para 32 ,64 , 128 bits de representação, cm 

todas um bit sinal. 

Memória 

Com capacidade par executar theads simultaneamente, uma interface rápida de 

acesso a memoria é extremamente importante para Niagara. Para suprir a alta 

demanda de dados, o processador conta com quatro controladores de memoria 

DDR2 integrado. A integrar o controlador de memoria com o processador, fazemos 

com que ele funcione na mesma frequência do processador. Recebendo 

informações da memoria muito mais rápida. 

Cache 

Um dos principais limitadores a velocidade de processamento é o tempo de 

latência das memórias, que é o tempo despendido desde a solicitação de dados pelo 

processador até o recebimento dos mesmos. Para diminuir os efeitos deste 

problema existem os cache: memória pequena e rápida, em um nível mais próximo 

ao processador, que servem para armazenar os dados e instruções com maior 

probabilidade de serem solicitados pelo processador. 

Cada core do processador Sun Niagara possui um L1 de 24KB, dividido em um 

cache de instruções de 16 KB, com bloco de 32 B e um cache de dados de 8 KB,

12 

com blocos de 16B, ambos four-way set associativa, com bloco de 64B, que é 

compartilhado entre os 8 cores. Para manter a coerência de cache, é utilizada a 

técnica de write – through. 

Tendências evolutivas dos processadores: o que as empresas 

planejam 

O aumento de velocidade na freqüência de execuções atribuídas ao 

processador medida em gigahertz, esta se tornando defasada, dando lugar à 

multiplicação dos núcleos de processamento. Obter dois núcleos não significa ter o 

dobro de poder de processamento, mas permite utilizar várias tarefas ao mesmo 

tempo com grande desempenho. Buscar um maior poder de processamento, 

estabelecendo técnicas de aumento da freqüência e de números de transistores são 

técnicas usadas nos processadores de único núcleo. Daí surge um problema, o 

aquecimento do processador e o gerenciamento de energia. 

A Intel utilizou em seu processador Dual Core uma tecnologia que são usadas 

cinco portas de envio, pela qual são enviadas três microinstruções para unidade de 

execução por pulso de clock, uma nova tendência da Intel é o uso real de 128 bits 

no caminho de dados, nos processadores anteriores era de 64 bits, isto significa um 

maior poder de processamento para manipulação de dados de 128 bits. 

A AMD criou uma tecnologia chamada de HyperTranport que é uma 

arquitetura de conexão direta com a memória principal, tendo um controlador de 

memória DDR integrado facilitando o acesso rápido pelo processador. A arquitetura 

de 64 bits interage com qualquer software, facilitando as aplicações de 64 bits, tanto 

as aplicações de 32 quanto os de 64 bits são executadas de forma simultânea na 

mesma plataforma. 

O processador da AMD de duplo núcleo é diferente da arquitetura da Intel, os 

processadores Athlon 64 e Opteron a ponte norte do chipset esta integrada dentro 

do próprio processador, permitindo ao processador a troca de informações entre si 

de forma paralela. Na arquitetura da Intel se um dos núcleos precisa enviar dados 

para outro núcleo inicia-se um processo em que, ele tem que pedir permissão à

13 

ponte norte, que esta localizada fora do processador, tendo como conseqüência o 

acesso a uma velocidade menor. 

Recursos e benefícios 

A partir dos detalhes evidenciados acerca dos processadores de duplonúcleo, 

faz-se necessário um benchmark (comparação) entre essas CPU, 

destacando algumas vantagens (e desvantagens) de um processador de dois ou 

mais núcleos. Então, temos que o multiprocessamento é uma idéia antiga - afinal, 

diz um velho ditado que "duas cabeças pensam melhor do que uma" -, mas a 

criação de chips com múltiplos núcleos reflete a dificuldade de se aumentar ainda 

mais a velocidade do processador sem implementar rebuscados (e caros) artifícios 

para controlar o superaquecimento. 

Em vista disso, a Intel cancelou o lançamento do Pentium 4 de 4GHz 

(“Prescott”) e partiu para a linha Pentium D - e, mais adiante, para o Core2Duo. Em 

linhas gerais, essa solução consiste em obter mais poder de processamento sem 

elevar a freqüência de operação, investindo na distribuição das tarefas por dois 

núcleos encapsulados numa mesma pastilha de silício. 

Chips com dois ou mais núcleos (porque os quad-core não tardam a chegar) 

apresentam algumas diferenças em relação aos da tecnologia anterior, sendo a 

primeira delas nominal: a indicação de velocidade baseada em GHz deixa de fazer 

sentido, porque os dois núcleos operam geralmente na mesma velocidade - mas seu 

trabalho conjunto, combinado com o cache compartilhado, os torna mais eficientes 

(enquanto um núcleo grava um CD, por exemplo, o outro pode rodar um game, com 

comunicação total entre eles, ou edição de um vídeo, etc.). Isso sem mencionar que 

o ganho não se limita apenas ao processamento: a interação entre os núcleos 

consome menos energia, diminui a quantidade de calor dissipado e abre um leque 

de soluções para os problemas que impediam o avanço dos microprocessadores: o 

superaquecimento. Ao dividir tarefas com os dois núcleos, o processador produz o 

calor padrão do seu clock (2,16 GHz, por exemplo) sem avançar na sua curva 

geométrica de aquecimento.

14 

Tudo indica que esse tipo de CPU deverá integrar a maioria dos desktops e 

servidores a ser fabricado ao longo dos próximos anos. Nesse aspecto, um fator que 

pode ser encarado como uma desvantagem é o custo alto para o consumidor final 

destes produtos, que ainda estão em fase de desenvolvimento e disseminação no 

mercado. E como deverá se tornar padrão (tanto para Intel quanto para AMD), essa 

inovação acabará forçando os fabricantes a queimar seus estoques de chips 

convencionais, visando preparar o mercado para a popularização das novas linhas 

Core 2 Duo e Athlon X2. 

Vale lembrar que o pleno aproveitamento dos chips de múltiplos núcleos 

requer adequações em nível de software - a menos que os sistemas e aplicativos 

sejam reescritos, os benefícios não são tão representativos assim. Se por exemplo, 

tratarmos de um usuário que utiliza softwares “comuns” como um editor de textos, 

uma planilha de dados, etc., o desempenho pode não ser tão evidenciado quanto 

para outro usuário que trabalhe com edição de imagens ou jogos. 

Outros fabricantes para montagem de servidores 

Power6 

A IBM lançou o processador Power6 para ser utilizado em servidores, é um 

processador com 2 a 16 núcleos nas velocidades 3,50, 4,20 ou 4,70GHz. Essa 

freqüência de clock é mais que o dobro da do Power5, o antecessor do novo chip. É, 

também, mil vezes a freqüência de clock do primeiro IBM PC, lançado em 1981. 

Aquele PC pioneiro rodava a 4,77 MHz. Além do clock mais rápido, o Power6 tem 

cache interno de 8 MB, quatro vezes o do Power5. O Power6 possui um barramento 

de dados ultra-rápido, o processador troca dados com a placa-mãe a uma 

velocidade de até 300 GB/s. 

Um servidor System p570 construído com esse chip já bateu 25 recordes de 

desempenho. A empresa diz, ainda, que o novo processador, mesmo rodando a 4,7 

GHz, consome a mesma quantidade de energia que o Power5 a 2,2 GHz. 

Adicionalmente, o chip permite desacelerar o clock para poupar energia. O Power6 

compete com os processadores da Sun e da Intel. Os concorrentes, porém,

15 

concentraram-se em aumentar o número de núcleos. A Sun tem processadores 

UltraSPARC T1 de 8 núcleos; e a Intel deve lançar o seu Xeon de 8 núcleos no 

segundo semestre. A IBM, ao contrário, acelerou o clock e a transferência de dados, 

mas manteve apenas dois núcleos no chip.

Apostilas Processadores CORE.pdf

Create successful ePaper yourself

Delete template?

Save as template?