pdf (90) - Faculdade de Informática - pucrs
pdf (90) - Faculdade de Informática - pucrs
pdf (90) - Faculdade de Informática - pucrs
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
propósito específico para execução do algoritmo <strong>de</strong> retro-propagação. Os três processadores neurais<br />
foram projetados para compartilhar o máximo <strong>de</strong> hardware, com a finalida<strong>de</strong> <strong>de</strong> reduzir informação<br />
<strong>de</strong> configuração para cada passo <strong>de</strong> reconfiguração.<br />
Assim como no caso do RRANN, o RRANN-II envolveu o projeto <strong>de</strong> um processador neural <strong>de</strong><br />
propósito geral e um conjunto <strong>de</strong> processadores <strong>de</strong> propósito específico para executar o algoritmo <strong>de</strong><br />
retro-propagação. RRANN-II difere <strong>de</strong> RRANN por explorar as similarida<strong>de</strong>s entre os processadores<br />
neurais. Os 3 processadores neurais são projetados para compartilhar o máximo <strong>de</strong> hardware possível,<br />
no intuito <strong>de</strong> reduzir os dados <strong>de</strong> configuração, em cada passo <strong>de</strong> reconfiguração [HAD95]. Quanto<br />
mais recursos compartilhados por cada processador, menos dados <strong>de</strong> configuração são necessários<br />
para converter um processador neural para o próximo.<br />
Para o projeto <strong>de</strong> reconfiguração dinâmica intrínseca <strong>de</strong> RRANN-II foi necessário muito esforço<br />
<strong>de</strong> projeto e layout manual. Funções comuns foram i<strong>de</strong>ntificadas manualmente e também manual-<br />
mente mapeadas no hardware. Funções únicas a cada estágio foram i<strong>de</strong>ntificadas e projetadas para<br />
operar corretamente com os subcircuitos remanescentes no dispositivo durante a configuração.<br />
Os parâmetros <strong>de</strong> 60 neurônios para um sistema estático e outro dinâmico são listados na Tabela<br />
2.3. Como mostrado, o circuito <strong>de</strong> propósito específico RTR completa o algoritmo com um terço do<br />
hardware necessário para o sistema estático. Esta redução <strong>de</strong> hardware acarreta um incremento na<br />
<strong>de</strong>nsida<strong>de</strong> funcional <strong>de</strong> 168% sobre a alternativa estática.<br />
<br />
<br />
<br />
<br />
<br />
Tabela 2.3: Parâmetros <strong>de</strong> circuito para uma re<strong>de</strong> neural com 60 neurônios no sistema RRANN-II.<br />
ESTÁTICO RTR<br />
Máximo Global Parcial<br />
CONEXÕES 10980 10980 10980 10980<br />
(células) 50764 18094 18<strong>90</strong>4 18<strong>90</strong>4<br />
(ms) 1,49 1,49 1,49 1,49<br />
(ms) N/A 0 2,42 1,16<br />
N/A 0 1,62 0,78<br />
146 391 148 219<br />
0 1,68 0,014 0,50<br />
Para calcular a <strong>de</strong>nsida<strong>de</strong> funcional real do sistema RTR o tempo <strong>de</strong> configuração <strong>de</strong>ve ser co-<br />
nhecido. Os três passos <strong>de</strong> reconfiguração requeridos pelo RRANN-II consomem 2,42ms quando a<br />
reconfiguração global é utilizada. Apesar <strong>de</strong> isto justificar o sistema com uma taxa <strong>de</strong> reconfigura-<br />
ção <strong>de</strong> 1,62ms, o incremento total obtido pela utilização <strong>de</strong> RTR é <strong>de</strong> apenas 1,4%. Reconfigurando<br />
somente as partes do circuito que precisam ser mudadas, o tempo <strong>de</strong> reconfiguração é reduzido para<br />
1,16ms. Esta redução no tempo <strong>de</strong> configuração tem impacto significante na <strong>de</strong>nsida<strong>de</strong> funcional<br />
total. Como resumido na Tabela 2.3, a taxa <strong>de</strong> configuração é reduzida para 0,78 e um incremento na<br />
<strong>de</strong>nsida<strong>de</strong> funcional é <strong>de</strong> 50%.<br />
29