pdf (90) - Faculdade de Informática - pucrs

More documents

Recommendations

Info

Substituindo em (2.2) tem-se a densidade funcional acrescida do custo de configuração: A partir de (2.5) fica claro que o tempo de configuração reduz a densidade funcional. Contudo, apesar do tempo de configuração absoluto ser um importante parâmetro, o tempo de configuração relativamente ao tempo de execução é muito mais informativo. A taxa de configuração: define este importante parâmetro. O tempo total de operação pode ser expresso como: (2.5) (2.6) (2.7) Substituindo este tempo em (2.2) obtem-se a métrica de densidade funcional: Como sugerido em (2.8), tempos longos de configuração podem ser tolerados se houver um tempo longo de execução correspondente ( pequeno). No limite, se , a sobrecarga imposta pela configuração é negligenciável. Tais sistemas aproximam-se da máxima densidade funcional provida por RTR. Essa valor máximo ( ) é calculado ignorando-se o tempo de configuração: Usando-se , o limite superior do ( incremento ) sobre um sistema estático pode ser encontrado. Este parâmetro sugere o benefício máximo de um sistema RTR, e é uma boa indicação da pertinência da utilização de RTR para uma dada aplicação: (2.8) (2.9) (2.10) Além de propor essas métricas, os autores do artigo sugerem que ao projetar sistemas RTR procure-se aumentar ao máximo o tempo de execução do sistema, para que se justifique o uso de RTR. 26
2.4.1.2 Exemplo de comparação entre um sistema RTR com reconfiguração extrínseca e um sistema estático A seguir será justificado o tempo de configuração de uma aplicação RTR, segundo a abordagem apresentada acima. A aplicação analisada é a implementação de uma rede neural que usa o algoritmo de aprendizagem por retro-propagação em FPGAs (denominada RRANN-Runtime Reconfigured Neu- ral Network) [ELD94]. Como mostrado na Figura 2.6, o algoritmo é particionado em três estágios: pós-alimentação (feed-forward), retro-propagação (back-propagation) e atualização. Esse processo de três estágios é repetido até que o algoritmo de treinamento convirja. Figura 2.6: Três estágios do algoritmo de treinamento por retro-propagação. Como sugerido na Figura2.6, o algoritmo é executado da seguinte forma: 1. Configuração dos recursos do FPGA com o processador neural de pós-alimentação, e compu- tação dos dados; 2. O circuito de retro-propagação é configurado e entra em execução; 3. O circuito de atualização é implementado e executa, completando uma iteração do algoritmo. Este processo de reconfiguração e execução continua até os resultados do algoritmo de treinamen- to convergirem. Uma vez que a abordagem RTR requer todo hardware apenas por um estágio por vez, o algoritmo inteiro pode ser executado com menos recursos do que em uma abordagem estática. Este processo é uma reconfiguração em tempo de execução extrínseca, isto é, o sistema como um todo é reconfigurado dinamicamente, mas a reconfiguração do dispositivo é estática, uma vez que é interrompida a execução de uma determinada lógica para que outra seja configurada e executada. Ain- da assim é uma abordagem dinâmica, e a possibilidade de substituir controle e aritmética associados a um algoritmo inativo por outros estágios incrementa a eficiência do hardware. Na Tabela 2.2 são mostrados os parâmetros de comparação entre o sistema estático e o sistema dinâmico, para uma rede de 60 neurônios. Como mostrado, o circuito RTR completa o algoritmo com um terço do hardware necessário para o sistema estático. Essa redução em hardware fornece um incremento máximo na densidade funcional ( ) de 168% sobre a alternativa estática. Para calcular a densidade funcional de cada sistema, o tempo total de operação ( ) e a área 27 ( ) devem ser determinados. O tempo de execução e área de uma rede neural executando RRANN
Page 1: Pontifícia Universidade Católica
Page 5: Agradecimentos Um trabalho extenso
Page 8 and 9: viii
Page 11 and 12: Sumário RESUMO vii ABSTRACT ix LIS
Page 13 and 14: Capítulo 5: Ferramentas para recon
Page 15 and 16: Lista de Figuras 1.1 Gráfico indic
Page 17 and 18: Lista de Tabelas 2.1 Classificaçã
Page 19 and 20: Lista de Abreviaturas FPGA Field-Pr
Page 21 and 22: Capítulo 1 Introdução Este Capí
Page 23 and 24: mais flip-flops. A maioria das arqu
Page 25 and 26: ➢ Compatibilidade em relação a
Page 27 and 28: Essas lacunas motivam a pesquisa no
Page 29 and 30: Capítulo 2 Estado-da-arte em siste
Page 31 and 32: 2.1.1.2 Granularidade Granularidade
Page 33 and 34: ➢ FPGA sem acesso a memória exte
Page 35 and 36: ➢ Sistema dinâmico: Envolve um a
Page 37 and 38: Sistemas PRISM DECPerLe Splash Spyd
Page 39 and 40: do a cada elemento uma pequena cach
Page 41 and 42: Figura 2.4: Exemplo de relocação
Page 43 and 44: complicar os programas de roteament
Page 45: Os aumentos na eficiência providos
Page 49 and 50: propósito específico para execuç
Page 51 and 52: 2.4.2.2 O framework Dynasty Dynasty
Page 53 and 54: arquivo texto (nos formatos VHDL e
Page 55 and 56: hardware de tamanho arbitrário. Al
Page 57 and 58: Garp é um processador baseado no c
Page 59 and 60: Barramentos Globais n
Page 61 and 62: Figura 2.13: Esquema da estrutura i
Page 63 and 64: 2.6 Interfaces para conexão entre
Page 65: Wishbone utiliza uma arquitetura me
Page 68 and 69: plexidade, este programa de control
Page 70 and 71: aplicação Java escrita pelo usuá
Page 72 and 73: XHWIF, a interface de hardware Xili
Page 75 and 76: Capítulo 4 Hardware que habilita r
Page 77 and 78: A implementação do Cache Logic é
Page 79 and 80: Cada FPGA da família Virtex possui
Page 81 and 82: Figura 4.5: Abstração de um quadr
Page 83 and 84: O bitstream é composto por um flux
Page 85 and 86: A Figura 4.7-V inclui a escrita de
Page 87 and 88: Figura 4.10: Final de um arquivo de
Page 89 and 90: Assim, como mostrado na Figura 4.11
Page 91 and 92: Portanto, para este caso, o bit 14
Page 93 and 94: Capítulo 5 Ferramentas para reconf
Page 95 and 96: Tabela 5.1: Alguns comandos do JBit
Page 97 and 98:
sas coordenadas foi explicado no it
Page 99 and 100:
Figura 5.5: Interface do reconfigur
Page 101 and 102:
Figura 5.6: Interface do Reconfigur
Page 103 and 104:
linha 11 determina um reset no regi
Page 105 and 106:
Tabela 5.3: Bits configuráveis do
Page 107 and 108:
Figura 5.9: Visualização do core
Page 109 and 110:
Figura 5.11: Seleção de um core n
Page 111 and 112:
A computação reconfigurável pres
Page 113:
➢ Os módulos em questão devem p
Page 116 and 117:
causa de problemas já descritos. A
Page 119 and 120:
Referências Bibliográficas [ALG89
Page 121 and 122:
[IBM99] IBM. The CoreConnect bus ar
Page 123:
[XIL99a] XILINX. XC6200 datasheet.
show all

pdf (90) - Faculdade de Informática - pucrs

Create successful ePaper yourself

Delete template?

Save as template?