Modelaç ˜ao do Acoplamento Via Substrato em Circuitos ... - INESC-ID

UNIVERSIDADE TÉCNICA DE LISBOA 

INSTITUTO SUPERIOR TÉCNICO 

Modelação do Acoplamento Via Substrato em 

Circuitos Mistos Analógico-Digitais 

João Manuel Santos Silva 

(Licenciado) 

Dissertação para Obtenção do Grau de Mestre em Engenharia 

Electrotécnica e de Computadores 

Orientador Científico: Prof. Luís Miguel Teixeira D’Ávila Pinto da Silveira 

Presidente do Júri: Prof. Luís Miguel Teixeira D’Ávila Pinto da Silveira 

Vogais: Prof. a Maria Helena Silva Fino 

Prof. Fernando Manuel Duarte Gonçalves 

Lisboa, Maio de 2003

UNIVERSIDADE TÉCNICA DE LISBOA 

INSTITUTO SUPERIOR TÉCNICO 

Modelação do Acoplamento Via Substrato em 

Circuitos Mistos Analógico-Digitais 

João Manuel Santos Silva 

(Licenciado) 

Dissertação para Obtenção do Grau de Mestre em Engenharia 

Electrotécnica e de Computadores 

Orientador Científico: Prof. Luís Miguel Teixeira D’Ávila Pinto da Silveira 

Presidente do Júri: Prof. Luís Miguel Teixeira D’Ávila Pinto da Silveira 

Vogais: Prof. a Maria Helena Silva Fino 

Prof. Fernando Manuel Duarte Gonçalves 

Lisboa, Maio de 2003

O trabalho subjacente à presente dissertação foi realizado sob a orientação do 

Prof. Luís Miguel Silveira 

Professor Associado do Departamento de Engenharia Electrotécnica e de Computadores 

do Instituto Superior Técnico

Resumo 

O trabalho subjacente à presente dissertação abrange as áreas de modelação, extracção e 

simulação de efeitos de acoplamento pelo substrato em circuitos integrados. 

Foram estudadas técnicas de modelação tridimensional do substrato, baseadas numa 

formulação diferencial das equações electromagnéticas do meio. É considerado, neste tra- 

balho, um modelo de substrato puramente resistivo, válido para frequências de operação 

até cerca de 10 GHz para as tecnologias actuais. 

Tendo como objectivo a extracção automática do modelo de acoplamento pelo sub- 

strato, desenvolveu-se uma ferramenta de software, o SMX (Substrate Model eXtractor), 

capaz de interpretar as descrições do layout e do processo de fabrico de um circuito inte- 

grado genérico e de apresentar, como resultado, uma matriz de resistências que representa 

a interacção entre os diversos contactos do circuito em análise. 

O passo computacionalmente mais exigente da ferramenta desenvolvida é a resolução 

de um sistema linear de equações, tendo sido estudados diversos métodos para o efeito. 

Destes métodos, destacam-se os seguintes: o Multigrid, pertencente à classe de algoritmos 

Multi-nível, os métodos iterativos pré-condicionados, baseados na exploração de sub- 

espaços de Krylov, e um misto de ambos, o método do Gradiente Conjugado Pré-condi- 

cionado por Multigrid (MGPCG). 

Verificou-se que um dos principais problemas da ferramenta desenvolvida são os seus 

requisitos de memória, sendo algo a melhorar no futuro, de modo a possibilitar a sua 

aplicação a problemas de complexidade industrial. No entanto, a introdução dos métodos 

Multigrid e MGPCG como métodos de resolução do sistema de equações fomenta a 

aceleração de todo o processo de extracção, fazendo do SMX uma ferramenta com uma 

boa relação precisão versus eficiência. 

O modelo resistivo do substrato obtido pelo SMX foi validado com base em ex- 

i

ii RESUMO 

periências fisicamente comprováveis e através da comparação com modelos obtidos por 

outras ferramentas de extracção. 

Foi ainda delineada e testada uma forma de obter modelos resistivo-capacitivos do 

acoplamento pelo substrato. 

Palavras-Chave Circuitos integrados analógico-digitais, acoplamento pelo substrato, 

modelos eléctricos, Multigrid, métodos de sub-espaços de Krylov pré-condicionados.

Abstract 

The work undertaken during this dissertation comprises the areas of modeling, extraction 

and simulation of substrate coupling effects in integrated circuits. 

Techniques for tridimensional modeling of the substrate based on a differential formu- 

lation of the electromagnetic medium were studied. These techniques led to the extraction 

of a purely resistive substrate model that is valid for frequencies up to a few GHz. 

In order to automatically extract such substrate coupling models, a software tool, SMX 

(Substrate Model eXtractor), has been developed. SMX receives a generic integrated 

circuit layout and corresponding process description, and outputs the conductance matrix, 

which relates all contacts of the substrate, i.e., models substrate interactions. 

The most important and costly step of the extraction procedure is to solve a linear 

system of equations. Several methods were studied in order to solve that system but only 

a few of them stand out. These are the Multigrid method, which belongs to the class of 

Multilevel algorithms, preconditioned Krylov subspace methods, and a hybrid of both, 

Multigrid Preconditioned Conjugate Gradient, MGPCG. 

The main handicap of the developed software tool is related to its memory require- 

ments, which is something to optimize in the future, in order to make it possible to apply 

SMX to industrial size circuits. Notwithstanding, the use of Multigrid or MGPCG as lin- 

ear system solvers brings a speed-up factor to SMX, which makes it an advantageous tool 

in substrate model extraction. 

The electric model obtained by SMX has been validated by comparing it to models 

obtained by other extractors, corresponding to physically verifiable experiences. 

Finally, a method has been developed with the objective of obtaining RC substrate 

models, instead of purely resistive models. 

iii

iv ABSTRACT 

Keywords Mixed-signal integrated circuits, substrate coupling, electric models, Multi- 

grid, Krylov subspace preconditioned methods.

Agradecimentos 

Gostaria de agradecer ao Prof. Luís Miguel Silveira pelo incansável apoio, incentivo, 

exigência e paciência demonstrados, bem como pelo dedicado trabalho de revisão desta 

dissertação. 

Em segundo lugar agradeço a todos os investigadores do grupo ALGOS do INESC ID 

e à Ana de Jesus pelo auxílio prestado e pelo bom ambiente de trabalho. 

Um agradecimento especial para a minha família e amigos que me apoiaram nos 

momentos de maior desalento e me incentivaram no percurso da minha actividade de 

investigação. 

Por último, agradeço também ao Eng ō Ricardo Chaves pelo trabalho de revisão deste 

documento. 

v

vi AGRADECIMENTOS

Conteúdo 

Resumo i 

Abstract iii 

Agradecimentos v 

Lista de Acrónimos xxi 

Notação Utilizada xxiii 

1 Introdução 1 

1.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 

1.2 Organização do documento . . . . . . . . . . . . . . . . . . . . . . . . . 3 

1.3 Contribuições Originais . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 

2 Modelação dos Acoplamentos pelo Substrato 5 

2.1 Formulação do Modelo do Substrato . . . . . . . . . . . . . . . . . . . . 5 

2.1.1 Considerações Geométricas . . . . . . . . . . . . . . . . . . . . 5 

2.1.2 Considerações Electromagnéticas . . . . . . . . . . . . . . . . . 6 

2.2 Resolução do Modelo do Substrato . . . . . . . . . . . . . . . . . . . . . 7 

2.2.1 Métodos de Resolução do Modelo . . . . . . . . . . . . . . . . . 8 

2.2.2 Tipos de Discretização dos Métodos FDM . . . . . . . . . . . . . 9 

2.2.3 Simplificação do Modelo a Resolver . . . . . . . . . . . . . . . . 12 

2.2.4 Considerações Sobre o Acoplamento Capacitivo do Substrato . . 13 

2.3 Extracção do Modelo do Substrato . . . . . . . . . . . . . . . . . . . . . 15 

vii 

i

viii CONTEÚDO 

2.3.1 Método de Extracção do Modelo . . . . . . . . . . . . . . . . . . 15 

2.3.2 Matriz do Sistema de Equações a Resolver . . . . . . . . . . . . 18 

2.4 Trabalho Prévio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 

3 Métodos de Resolução do Sistema de Equações 27 

3.1 Métodos Directos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 

3.1.1 Método de Eliminação de Gauss . . . . . . . . . . . . . . . . . . 28 

3.2 Métodos Iterativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 

3.2.1 Métodos de Relaxação . . . . . . . . . . . . . . . . . . . . . . . 30 

3.2.2 Métodos de Krylov . . . . . . . . . . . . . . . . . . . . . . . . . 35 

3.2.3 Métodos de Krylov Pré-Condicionados . . . . . . . . . . . . . . 39 

4 Métodos Multi-Nível 43 

4.1 Multigrid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 

4.1.1 Operadores de Projecção e Interpolação . . . . . . . . . . . . . . 44 

4.1.2 Multigrid V-Cycle . . . . . . . . . . . . . . . . . . . . . . . . . 49 

4.1.3 Full Multigrid Cycle . . . . . . . . . . . . . . . . . . . . . . . . 51 

4.2 Multigrid Preconditioned Conjugate Gradient . . . . . . . . . . . . . . . 52 

4.3 Análise do Desempenho do Algoritmo Multigrid . . . . . . . . . . . . . 52 

4.3.1 Análise da Complexidade do Multigrid . . . . . . . . . . . . . . 53 

4.3.2 Parâmetros e Factores que Afectam o Desempenho do Multigrid . 59 

5 Validação do Modelo Extraído 75 

5.1 Metodologia de Teste . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 

5.2 Configurações de Teste . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 

5.2.1 Condutância entre um contacto e o backplane . . . . . . . . . . . 76 

5.2.2 Condutância entre dois contactos . . . . . . . . . . . . . . . . . . 76 

5.2.3 Variação da Profundidade dos Contactos . . . . . . . . . . . . . . 77 

5.2.4 Variação da Profundidade do Substrato . . . . . . . . . . . . . . 78 

5.2.5 Variação da Resistividade do Substrato . . . . . . . . . . . . . . 80 

5.2.6 Variação da Área do Substrato . . . . . . . . . . . . . . . . . . . 80 

5.2.7 Variação da Distância entre Contactos . . . . . . . . . . . . . . . 81 

5.3 Estudo Eléctrico dos Efeitos de Acoplamento . . . . . . . . . . . . . . . 82

CONTEÚDO ix 

5.3.1 Posicionamento dos Contactos . . . . . . . . . . . . . . . . . . . 82 

5.3.2 Dimensão dos Contactos . . . . . . . . . . . . . . . . . . . . . . 83 

5.3.3 Utilização de Backplane . . . . . . . . . . . . . . . . . . . . . . 84 

5.3.4 Utilização de Guard-rings . . . . . . . . . . . . . . . . . . . . . 86 

5.3.5 Perfil do Substrato . . . . . . . . . . . . . . . . . . . . . . . . . 88 

5.3.6 Distância de um contacto aos limites do substrato . . . . . . . . . 90 

5.4 Exemplo de Circuito de Complexidade Industrial . . . . . . . . . . . . . 92 

6 Comparação Entre Métodos 95 

6.1 Configurações de Teste . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 

6.1.1 Um Contacto Com Backplane . . . . . . . . . . . . . . . . . . . 95 

6.1.2 Dois Contactos Sem Backplane . . . . . . . . . . . . . . . . . . 100 

6.2 Característica de Convergência dos Métodos . . . . . . . . . . . . . . . . 102 

6.3 Análise Experimental da Complexidade dos Métodos . . . . . . . . . . . 103 

6.3.1 Complexidade do Número de Iterações . . . . . . . . . . . . . . 103 

6.3.2 Complexidade do Tempo de Execução . . . . . . . . . . . . . . . 104 

6.3.3 Complexidade do Tempo de Iteração . . . . . . . . . . . . . . . . 104 

6.3.4 Complexidade dos Requisitos de Memória . . . . . . . . . . . . 104 

7 Extracção de Modelos Dinâmicos Capacitivos 111 

7.1 Modelos RC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 

7.2 Modelos RC para Substratos com Apenas Uma Camada . . . . . . . . . . 115 

7.3 Gama de Validade do Modelo RC . . . . . . . . . . . . . . . . . . . . . 117 

7.3.1 Relevância dos Modelos Dinâmicos . . . . . . . . . . . . . . . . 117 

7.3.2 Precisão do Modelo RC . . . . . . . . . . . . . . . . . . . . . . 119 

8 Conclusões e Trabalho Futuro 123 

A Manual do SMX 127 

A.1 Instalação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 

A.2 Execução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 

A.3 Fluxograma do SMX . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

x CONTEÚDO 

B Análise da Complexidade dos Métodos Iterativos 131 

B.1 Método de Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 

B.2 Método de Gauss-Seidel . . . . . . . . . . . . . . . . . . . . . . . . . . 132 

B.3 Método de Sobre-Relaxação Sucessiva, SOR . . . . . . . . . . . . . . . 132 

B.4 Método GMRES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 

B.5 Método do Gradiente Conjugado, CG . . . . . . . . . . . . . . . . . . . 133 

B.6 Método do Gradiente Conjugado Pré-condicionado, PCG . . . . . . . . . 135

Lista de Figuras 

1.1 Mecanismo de injecção de corrente no substrato (a) e modelo eléctrico 

correspondente (b). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 

2.1 Modelo geométrico do substrato. . . . . . . . . . . . . . . . . . . . . . . 6 

2.2 Discretização das superfícies dos contactos segundo o Método dos Ele- 

mentos Fronteira. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 

2.3 Discretização uniforme. . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 

2.4 Discretização não-uniforme. . . . . . . . . . . . . . . . . . . . . . . . . 11 

2.5 Vistas de topo (a) e lateral (b) da discretização adaptável. Unidades em µm. 11 

2.6 Volumes resultantes da discretização do substrato. . . . . . . . . . . . . . 12 

2.7 Elementos capacitivos relevantes no acoplamento pelo substrato. . . . . . 14 

2.8 Modelo de acoplamento. . . . . . . . . . . . . . . . . . . . . . . . . . . 16 

2.9 Esquema de numeração dos nós. . . . . . . . . . . . . . . . . . . . . . . 19 

2.10 Esquema de ligações entre nós. . . . . . . . . . . . . . . . . . . . . . . . 19 

2.11 Estrutura da matriz de sistema. . . . . . . . . . . . . . . . . . . . . . . . 20 

3.1 Matriz de sistema antes (a) e depois (b) do processo de eliminação de Gauss. 29 

3.2 Função de erro (a) e suas componentes de alta (b) e baixa (c) frequências. 31 

3.3 Convergência dos Métodos de Jacobi, Gauss-Seidel e SOR. . . . . . . . . 36 

4.1 Projecção directa a uma dimensão. . . . . . . . . . . . . . . . . . . . . . 45 

4.2 Projecção pesada a uma dimensão. . . . . . . . . . . . . . . . . . . . . . 45 

4.3 Interpolação a uma dimensão. . . . . . . . . . . . . . . . . . . . . . . . 47 

4.4 Esquema de numeração de condutâncias. . . . . . . . . . . . . . . . . . . 48 

4.5 Multigrid de ciclo completo. . . . . . . . . . . . . . . . . . . . . . . . . 52 

4.6 Vista de topo da configuração de teste 1. . . . . . . . . . . . . . . . . . . 61 

xi

xii LISTA DE FIGURAS 

4.7 Vista lateral da configuração de teste 1. . . . . . . . . . . . . . . . . . . . 61 

4.8 Evolução da resistência extraída com o nível de discretização. . . . . . . 63 

4.9 Problema das projecções directa e pesada. . . . . . . . . . . . . . . . . . 65 

5.1 Configuração de teste 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 


5.3 Configuração para Comparação dos Extractores. . . . . . . . . . . . . . . 78 

5.4 Configuração com dois contactos para comparação entre extractores. . . . 81 


5.6 Evolução da resistência entre dois contactos conforme se varia a distância 

entre eles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 


5.8 Evolução da resistência entre dois contactos conforme se varia a dimensão 

de ambos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 

5.9 Configuração de teste 5a. . . . . . . . . . . . . . . . . . . . . . . . . . . 86 

5.10 Configuração de teste 5b. . . . . . . . . . . . . . . . . . . . . . . . . . . 87 

5.11 Evolução da resistência entre dois contactos conforme se varia a profun- 

didade do guard-ring. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 

5.12 Perfis de substrato. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 


5.14 Layout do circuito de complexidade industrial (PLL) utilizado para teste. . 93 

6.1 Layout da configuração de um contacto com backplane. . . . . . . . . . . 96 

6.2 Perfil do substrato da configuração de um contacto com backplane. . . . . 96 

6.3 Layout da configuração de dois contactos sem backplane. . . . . . . . . . 101 

6.4 Perfil do substrato da configuração de dois contactos sem backplane. . . . 101 

6.5 Evolução da norma do resíduo ao longo do número de iterações para 

discretizações de 33 33 17 (a), 65 65 33 (b) e 129 129 65 

(c). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 

6.6 Evolução da norma do resíduo conforme o número de iterações. . . . . . 107 

6.7 Complexidade do número de iterações. . . . . . . . . . . . . . . . . . . 107 

6.8 Complexidade do tempo de execução. . . . . . . . . . . . . . . . . . . . 108

LISTA DE FIGURAS xiii 

6.9 Complexidade do tempo de iteração. . . . . . . . . . . . . . . . . . . . 108 

6.10 Complexidade de memória. . . . . . . . . . . . . . . . . . . . . . . . . 109 

7.1 Modelo RC para uma configuração de três contactos. . . . . . . . . . . . 112 

7.2 Modelo resistivo-capacitivo do substrato. . . . . . . . . . . . . . . . . . 113 

7.3 Esquema do equivalente de Norton para modelos resistivo-capacitivos. . . 114 

7.4 Layout e perfil do substrato para o circuito de teste com três contactos. . . 117 

7.5 Diagrama de Bode do ganho da função H(s). . . . . . . . . . . . . . . . . 121 

7.6 Diagrama de Bode comparativo entre os modelos reduzido e tridimensional.122 

A.1 Fluxograma do SMX . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

xiv LISTA DE FIGURAS

Lista de Tabelas 

3.1 Evolução do raio espectral da matriz de iteração de Gauss-Seidel con- 

soante a complexidade do problema. . . . . . . . . . . . . . . . . . . . . 35 

3.2 Evolução do número de condição da matriz de sistema consoante a com- 

plexidade do problema. . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 

4.1 Requisitos de memória para o primeiro nível do Multigrid. . . . . . . . . 58 

4.2 Requisitos de memória para o segundo nível do Multigrid. . . . . . . . . 58 

4.3 Número de operações para os diversos métodos apresentados. . . . . . . . 59 

4.4 Requisitos de memória para os diversos métodos apresentados. . . . . . . 60 

4.5 Influência do nível de discretização não-uniforme na precisão do resul- 

tado obtido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 

4.6 Influência do nível de discretização não-uniforme adaptável na precisão 

do resultado obtido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 

4.7 Condicionamento da matriz de sistema consoante o método de discretização 

utilizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 

4.8 Evolução do tempo de execução do Multigrid em função do número de 

níveis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 

4.9 Desempenho do Multigrid face ao tipo de projecção utilizado. . . . . . . 67 

4.10 Influência do backplane no desempenho do Multigrid. . . . . . . . . . . . 67 

4.11 Influência do número de iterações de relaxação no desempenho do Multi- 

grid. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 

4.12 Influência da tolerância exigida ao Multigrid no seu desempenho. . . . . . 69 

4.13 Desempenho do Multigrid face ao algoritmo utilizado no nível inferior. . 70 

4.14 Impacto da utilização de um método de suavização do resíduo no desem- 

penho do Multigrid. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 

xv

xvi LISTA DE TABELAS 

4.15 Importância da existência de uma aproximação inicial no desempenho do 

Multigrid. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 

4.16 Impacto da resistividade do substrato no condicionamento do sistema a 

resolver. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 

5.1 Comparação entre os resultados dos vários extractores para diferentes 

profundidades de contacto. . . . . . . . . . . . . . . . . . . . . . . . . . 79 

5.2 Comparação entre os resultados dos vários extractores para diferentes 

profundidades do substrato. . . . . . . . . . . . . . . . . . . . . . . . . . 79 

5.3 Comparação entre os resultados dos vários extractores para diferentes re- 

sistividades do substrato. . . . . . . . . . . . . . . . . . . . . . . . . . . 80 

5.4 Comparação entre os resultados dos vários extractores para diferentes di- 

mensões da área do substrato. . . . . . . . . . . . . . . . . . . . . . . . . 81 

5.5 Comparação entre os resultados dos vários extractores conforme a distância 

entre os dois contactos. . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 

5.6 Variação da resistência extraída entre dois contactos consoante a distância 

entre eles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 

5.7 Variação da resistência extraída entre dois contactos consoante a dimensão 

dos contactos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 

5.8 Variação da resistência extraída entre dois contactos com e sem backplane. 85 

5.9 Variação da resistência extraída entre dois contactos consoante a profun- 

didade da barreira de resguarda usada. . . . . . . . . . . . . . . . . . . . 87 

5.10 Variação da resistência extraída entre dois contactos consoante a profun- 

didade do guard ring usado. . . . . . . . . . . . . . . . . . . . . . . . . 88 

5.11 Comparação das resistências extraídas para três perfis de substrato difer- 

entes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 

5.12 Evolução da resistência entre dois contactos face à proximidade de um 

deles do limite geométrico do substrato. . . . . . . . . . . . . . . . . . . 91 

5.13 Conjunto seleccionado de resistências de acoplamento para o circuito da 

PLL obtidas com o SMX. . . . . . . . . . . . . . . . . . . . . . . . . . . 93 

5.14 Recursos computacionais necessários para a extracção do modelo de acopla- 

mento pelo substrato relativo ao circuito da PLL. . . . . . . . . . . . . . 94

LISTA DE TABELAS xvii 

6.1 Comparação do número de iterações dos diversos métodos testados para 

uma configuração com um contacto. . . . . . . . . . . . . . . . . . . . . 96 

6.2 Comparação do tempo de execução (s) dos diversos métodos testados 

para uma configuração com um contacto. . . . . . . . . . . . . . . . . . 97 

6.3 Comparação do tempo de iteração (s) dos diversos métodos testados para 

uma configuração com um contacto. . . . . . . . . . . . . . . . . . . . . 98 

6.4 Comparação da memória (kB) ocupada pelos diversos métodos testados 

para uma configuração com um contacto. . . . . . . . . . . . . . . . . . 98 

6.5 Influência do processo de restarting no desempenho do GMRES. . . . . . 100 

6.6 Comparação do tempo de setup (s) dos diversos métodos testados para a 

configuração com um contacto. . . . . . . . . . . . . . . . . . . . . . . . 100 

6.7 Comparação do número médio de iterações dos diversos métodos testa- 

dos para uma configuração com dois contactos. . . . . . . . . . . . . . . 101 

6.8 Comparação do tempo de execução (s) dos diversos métodos testados 

para uma configuração com dois contactos. . . . . . . . . . . . . . . . . 102 

6.9 Comparação da memória (kB) ocupada pelos diversos métodos testados 

para uma configuração com dois contactos. . . . . . . . . . . . . . . . . 103 

7.1 Valores das resistências e capacidades do modelo de acoplamento pelo 

substrato para a configuração de três contactos. . . . . . . . . . . . . . . 118 

B.1 Número de operações para a iteração de Jacobi. . . . . . . . . . . . . . . 131 

B.2 Número de operações para a iteração de Gauss-Seidel. . . . . . . . . . . 132 

B.3 Número de operações para a iteração do método SOR. . . . . . . . . . . 132 

B.4 Número de operações para a iteração do método GMRES. . . . . . . . . 134 

B.5 Número de operações para a iteração do método CG. . . . . . . . . . . . 134 

B.6 Número de operações para a iteração do método PCG. . . . . . . . . . . 136

xviii LISTA DE TABELAS

Lista de Algoritmos 

1 GMRES, Generalized Minimum Residual . . . . . . . . . . . . . . . . . 37 

2 CG, Conjugate Gradient . . . . . . . . . . . . . . . . . . . . . . . . . . 38 

3 PGMRES, Preconditioned Generalized Minimum Residual . . . . . . . . 40 

4 PCG, Preconditioned Conjugate Gradient . . . . . . . . . . . . . . . . . 41 

5 Multigrid, xh¡MG h¢Ah£bh¤. . . . . . . . . . . . . . . . . . . . . . . . . 50 

6 Full Multigrid, xh¡FMG h¢Ah£bh¤. . . . . . . . . . . . . . . . . . . . . 51 

7 MGPCG, Multigrid Preconditioned Conjugate Gradient. . . . . . . . . . 53 

8 MRS, Minimum Residual Smoothing. . . . . . . . . . . . . . . . . . . . 72 

xix

xx LISTA DE ALGORITMOS

Lista de Acrónimos 

1D, Uma dimensão 

3D, Três dimensões 

BEM, Boundary Element Method 

CG, Conjugate Gradient 

DCT, Discrete Cosine Transform 

FDM, Finite Difference Method 

FEM, Finite Element Method 

FMG, Full MultiGrid (Full Cycle) 

GE, Gaussian Elimination 

GMRES, Generalized Minimal RESidual 

GS, Gauss-Seidel 

ICH, Incomplete CHolesky factorization 

MG, MultiGrid (V-Cycle) 

MGPCG, MultiGrid Preconditioned Conjugate Gradient 

PCG, Preconditioned Conjugate Gradient 

PGMRES, Preconditioned Generalized Minimal RESidual 

RC, Resistivo-Capacitivo 

xxi

xxii LISTA DE ACRÓNIMOS 

SMX, Substrate Model eXtractor 

SOR, Successive Over-Relaxation

Notação Utilizada 

m Número de cortes na direcção x 

n Número de cortes na direcção y 

d Número de cortes na direcção z 

N Dimensão do sistema, i.e., número de nós da grelha correspondente a 

m n d cortes 

do vector v 

interno entre os vectores v e w 

Norma 

Produto 

¥v¥ 

Número de operações de x 

¦v£w§ #op¢x¤ 

Adições 

Multiplicações 

¨ 

Divisões 

© 

xxiii

xxiv NOTAÇÃO UTILIZADA

Capítulo 1 

Introdução 

1.1 Motivação 

O trabalho que a presente dissertação reflecte centra-se no estudo do ruído em circuitos 

integrados mistos, ou seja, circuitos que incorporem simultaneamente funcionalidades 

analógicas e digitais sobre o mesmo substrato. 

Os circuitos digitais funcionam, actualmente, a frequências na ordem de alguns GHz, 

sendo que o ruído por eles introduzido no substrato é tanto maior quanto maior for essa 

frequência. São as variações de estado lógico dos circuitos digitais que, através de um 

efeito capacitivo, originam as correntes de fuga que fluem pelo substrato (Figura 1.1). 

D A 

J 

Vb 

(a) (b) 

Figura 1.1: Mecanismo de injecção de corrente no substrato (a) e modelo eléctrico cor- 

respondente (b). 

Em circuitos cuja tecnologia seja unicamente digital, o facto de haver correntes a 

migrar no interior do substrato não afecta, em princípio, o correcto funcionamento do 

1 

D 

Vb 

A

2 CAPÍTULO 1. INTRODUÇÃO 

circuito – embora os atrasos das portas lógicas possam sofrer alterações –, pois, regra 

geral, as tecnologias digitais exibem alguma imunidade ao ruído. No entanto, quando 

sobre o mesmo substrato estão implantados blocos analógicos a situação altera-se drasti- 

camente. A corrente que é injectada no substrato pelos transístores digitais pode alcançar 

a zona onde estão localizados os blocos analógicos e influenciar de um modo imprevisível 

o seu funcionamento. Veja-se o exemplo de [1], em que se optou pela separação física 

das partes analógica e digital, de modo a eliminar os indesejados efeitos de acoplamento. 

Este problema ocorre, por exemplo, porque o ruído introduzido pela parte digital pode 

fazer oscilar a tensão de polarização do substrato e, consequentemente, a tensão de corpo 

dos transístores analógicos. É sabido que quando se dimensionam transístores analógicos 

se leva em conta a existência do efeito de corpo e a sua influência no funcionamento 

dos dispositivos. No entanto, em geral, assume-se que a tensão do substrato é constante. 

Ora, se o nível de tensão do substrato oscilar, o estado de polarização dos transístores 

analógicos é afectado e a parte analógica do circuito pode deixar de funcionar tal como 

fora projectada. 

Uma solução para este tipo de problema é baseada numa estratégia de tentativa e erro, 

ou seja: projectar um circuito, fabricar um protótipo, testá-lo, proceder ao re-projecto 

e assim sucessivamente. Hoje em dia a implementação de tal estratégia é impensável, 

devido aos elevadíssimos custos que tal solução acarretaria. O objectivo é, cada vez mais, 

dispor de ferramentas de software que simulem idealmente o funcionamento físico dos 

circuitos, permitindo detectar na fase de projecto a eventual existência de problemas de 

nível físico e possibilitar o seu re-projecto de modo a obter circuitos cuja probabilidade 

de funcionamento correcto depois de fabricados seja elevada. 

O objectivo principal do trabalho relatado neste documento é o desenvolvimento de 

uma ferramenta capaz de elaborar um modelo do substrato de um circuito a partir do seu 

layout e características do processo de fabrico. O modelo assim obtido poderá ser usado, 

em conjunto com o modelo dos dispositivos construídos sobre o substrato, num simulador 

eléctrico que ateste o funcionamento “real” do circuito e permita a sua verificação. 

Existem, actualmente, ferramentas capazes de extrair modelos do substrato com pre- 

cisões variadas e baseados em diferentes aproximações [2, 3, 4, 11, 12, 13, 14, 15]. A 

ferramenta aqui apresentada pretende fornecer um modelo do substrato bastante preciso,

1.2. ORGANIZAÇÃO DO DOCUMENTO 3 

tentando, simultaneamente, não ser excessivamente pesada em termos computacionais. 

Para cumprir estes objectivos usou-se um algoritmo que segue a estrutura de um algo- 

ritmo Multi-nível, o Multigrid [16, 17, 18, 47]. Baseando-se numa formulação apropria- 

da das equações de Maxwell para os campos eléctrico e magnético, o problema original, 

contínuo, é discretizado pelo método das diferenças finitas segundo uma grelha tridimen- 

sional e projectado sucessivamente para grelhas de menor precisão, em que a resolução 

computacional do problema seja eficiente. O erro obtido na grelha mais grosseira é 

então interpolado para os níveis de maior precisão, onde a solução vai sendo ajustada. 

Quando escolhidos os operadores de projecção e interpolação adequados, e após algumas 

iterações, o algoritmo Multigrid foi demonstrado convergir para uma solução cumprindo 

uma determinada tolerância. A mais valia deste algoritmo é possuir uma complexidade 

temporal O¢N¤, em que N é o número de incógnitas do sistema de equações a resolver, 

inferior à complexidade dos restantes algoritmos estudados para resolver o mesmo pro- 

blema. 

1.2 Organização do documento 

Os restantes capítulos desta dissertação encontram-se divididos da seguinte forma: no 

Capítulo 2 são apresentadas as aproximações tidas em conta na geometria do proble- 

ma, a formulação do modelo electromagnético do substrato e métodos para discretizar, 

simplificar e resolver o problema. Nos dois capítulos seguintes apresentam-se métodos 

tradicionais de resolução do sistema computacional (Capítulo 3) e o método a que se deu 

mais ênfase no decorrer deste trabalho, o Multigrid (Capítulo 4). A validação do mod- 

elo extraído é feita no Capítulo 5. No Capítulo 6 compara-se o desempenho dos vários 

métodos na resolução do sistema computacional. No Capítulo 7 discute-se a validade 

do modelo resistivo explorado nesta dissertação e apresenta-se uma metodologia para a 

obtenção de modelos válidos para frequências mais elevadas. Por fim, tem-se um capítulo 

em que se tiram algumas conclusões e se apresentam perspectivas de trabalho futuro. 

Em apêndice, encontra-se o manual da ferramenta desenvolvida, o SMX, bem como 

alguns cálculos sobre a complexidade dos métodos iterativos testados.

4 CAPÍTULO 1. INTRODUÇÃO 

1.3 Contribuições Originais 

Foi desenvolvida e validada uma ferramenta de extracção de um modelo resistivo do sub- 

strato, o SMX – Substrate Model eXtractor. 

Foi estudado em pormenor o algoritmo Multigrid e optimizado o seu desempenho na 

resolução do problema numérico subjacente à extracção do modelo do substrato. 

Foram igualmente elaboradas experiências que permitissem tirar conclusões relativas 

ao desempenho comparativo entre o Multigrid e as suas vertentes, e os métodos de Krylov 

pré-condicionados. 

Por último, foi delineada e testada uma forma de obter um modelo resistivo-capacitivo 

do substrato, tendo-se descoberto que, no caso de substratos de camada única, a obtenção 

da parte capacitiva do modelo é trivial.

Capítulo 2 

Modelação dos Acoplamentos pelo 

Substrato 

2.1 Formulação do Modelo do Substrato 

De modo a poder representar o problema físico do acoplamento pelo substrato em cir- 

cuitos integrados, há que proceder à estipulação de modelos que simulem, com um nível 

de precisão adequado, o comportamento real do substrato em análise. Para isso, há que 

ter em consideração duas componentes fundamentais do modelo usado para representar o 

substrato: a componente geométrica, que modela a constituição física do substrato e dos 

dispositivos nele implantados, e a componente electromagnética, através da qual se pre- 

tendem representar de forma correcta as propriedades electromagnéticas dos diferentes 

tipos de material semicondutor que constituem o substrato. 

2.1.1 Considerações Geométricas 

No que toca à componente geométrica do modelo do substrato, neste trabalho considera- 

se que o substrato é constituído por um conjunto de camadas, dispostas verticalmente, de 

diferentes condutividades. Assume-se que em cada camada a condutividade é constan- 

te (camadas homogéneas). O substrato pode ser flutuante, colocado sobre uma camada 

isolante, ou estar ligado à massa, colocado sobre uma superfície metálica (backplane) 

ligada à alimentação positiva ou negativa, conforme se trate de um substrato do tipo n ou 

p, respectivamente. 

5

6 CAPÍTULO 2. MODELAÇÃO DOS ACOPLAMENTOS PELO SUBSTRATO 

Quanto ao modelo dos dispositivos implantados sobre o substrato, há vários tipos de 

material relevantes na interacção com o substrato: as difusões relativas a contactos de 

polarização ou anéis de resguardo (guard rings), as difusões pertencentes a transístores e 

os poços. As difusões são consideradas homogéneas, i.e., de condutividade constante. 

O número de camadas do substrato, bem como as suas três dimensões e condutivi- 

dade, são, no que respeita à ferramenta de software desenvolvida, parametrizáveis. São 

igualmente parametrizáveis as três dimensões das difusões e dos poços e a existência ou 

não de backplane. 

Na Figura 2.1 é exemplificado o modelo adoptado para o substrato neste trabalho. 

camada 1 

camada 2 

camada N 

p 

... 

d 

d1 

d2 

dN 

backplane 

Figura 2.1: Modelo geométrico do substrato. 

2.1.2 Considerações Electromagnéticas 

O comportamento electromagnético de qualquer meio é regido pelas leis de Maxwell: 

∇ H¡J∂D 

∂t 

∇ E¡∂B 

∂t 

(2.1) 

(2.2) 

∇D¡ρ (2.3) 

∇B¡0 (2.4)

2.2. RESOLUÇÃO DO MODELO DO SUBSTRATO 7 

em que E representa o campo eléctrico, D o deslocamento eléctrico, J a densidade de 

corrente, H o campo magnético, B a indução magnética e ρ a densidade de carga por 

unidade de volume. 

Para tecnologias em silício na ordem do µm e frequências de operação na ordem do 

GHz, a aproximação quase-estacionária das equações dos campos é válida. Tem-se, por- 

tanto, que 

(2.5) 

D¡εE 

Aplicando o operador gradiente a ambos os membros da Equação 2.1 e usando a 

aproximação 2.5, obtém-se 

ε ∂ 

(2.6) 

Sabendo 

∂t¢∇E¤∇J¡0 

que 

J¡E 

(2.7) 

a Equação 2.6 fica sob a forma: ρ£ 

ε ∂ 

(2.8) 

∂t¢∇E¤1 

É com base nesta equação que se vão modelar as propriedade electromagnéticas do 

ρ¢∇E¤¡0 

silício que constitui o substrato. 

2.2 Resolução do Modelo do Substrato 

Existem duas formas de resolver o problema em questão: a forma analítica e a forma 

numérica. Na forma analítica utiliza-se a formulação baseada nas leis de Maxwell e, 

com base nas propriedades de cada contacto e do meio que o envolve, calcula-se ca- 

da resistência de acoplamento individualmente, resolvendo analiticamente as equações 

respectivas. A forma numérica, por sua vez, consiste na resolução iterativa das leis de 

Maxwell, aproximadas segundo a discretização do domínio físico, i.e., do substrato. 

Dada a dimensão do problema, ou seja, a dimensão dos circuitos integrados actuais, 

a única forma realista de resolver o problema é computacionalmente. Deste modo, a


resolução analítica é muito complexa, embora resultasse numa solução exacta. Resta, 

portanto, a resolução numérica do problema. 

Para poder resolver um problema contínuo com o auxílio de um computador a correr 

um algoritmo numérico há que discretizar o problema. No caso do modelo do substrato, 

a discretização a fazer é no espaço, havendo duas possibilidade distintas de discretização, 

apresentadas na secção seguinte. 

2.2.1 Métodos de Resolução do Modelo 

Existem duas famílias de métodos para discretizar e, consequentemente, resolver o prob- 

lema em mãos: os métodos de elementos fronteira (BEM, Boundary Element Methods) e 

o conjunto dos métodos de diferenças finitas (FDM, Finite Difference Methods) e métodos 

de elementos finitos (FEM, Finite Element Methods), descritos nas seguintes sub-secções. 

Neste trabalho foi usado o FDM. Em [4] é apresentada a solução do mesmo problema pelo 

método BEM. 

Método dos Elementos Fronteira 

Estes métodos baseiam-se na discretização das fronteiras, normalmente em superfície, e 

na resolução das equações de Maxwell sob a forma integral. São somente discretizados 

os elementos relevantes da geometria do problema. Isto permite reduzir drasticamente a 

complexidade da discretização, dando origem a sistemas de equações mais simples. No 

caso do substrato, são apenas discretizados os contactos e os poços no seu interior, que 

são em volume muito menores que todo o volume ocupado pelo substrato em si. 

Este tipo de método tem sido utilizado com sucesso na extracção de modelos de 

interligações e acoplamentos [4, 5, 6, 7, 11, 14, 24]. 

Na Figura 2.2 é apresentado um esquema exemplificativo do substrato de um cir- 

cuito discretizado segundo o método BEM. A implementação computacional deste tipo 

de método, embora possa ser modesta em termos de memória, é pesada em termos de 

tempo. Pelo contrário, o método FDM, à custa da utilização de uma maior quantidade de 

memória, pode ser bastante mais rápido.


Figura 2.2: Discretização das superfícies dos contactos segundo o Método dos Elementos 

Fronteira. 

Método das Diferenças Finitas 

Neste método, ao contrário do método anterior, em que só os elementos relevantes são 

discretizados, todo o domínio é discretizado. No caso específico do substrato, isto corres- 

ponde a discretizar o mesmo nas três direcções, através de planos perpendiculares entre 

si, a que se chamam cortes. Este tipo de discretização conduz a sistemas de equações mais 

complexos, mas cuja resolução é mais simples. Existe, neste caso, um compromisso entre 

memória e tempo que pode ser vantajoso na resolução do problema em questão, como se 

verá à frente. 

2.2.2 Tipos de Discretização dos Métodos FDM 

Uma questão que se pode levantar perante o método de diferenças finitas é como proce- 

der à discretização do volume total do substrato. Para este efeito, existem dois tipos de 

discretização: uniforme e não-uniforme. Dentro da discretização não-uniforme foram ex- 

perimentadas duas vertentes: discretização com e sem ponderação da localização dos con- 

tactos. À discretização que não pondera a localização dos contactos chamar-se-á simples- 

mente discretização não-uniforme. A segunda discretização será apelidada de adaptável. 

Estes três métodos de discretização são apresentados de seguida.


Discretização Uniforme 

Figura 2.3: Discretização uniforme. 

Neste tipo de discretização procede-se à bissecção do volume do substrato por planos 

equi-espaçados em cada direcção. Depois de se decidir quantos cortes são necessários 

para discretizar o volume, procede-se à sua distribuição uniforme, tal como é ilustrado na 

Figura 2.3. 

Este tipo de discretização, embora simples, não considera a presença dos contac- 

tos e poços, seccionando-os como se se tratasse tudo do mesmo material semicondu- 

tor. Isto pode levantar problemas, pois os dispositivos pequenos face ao espaçamento da 

discretização usada podem ser ignorados. Por esta razão, este tipo de discretização não 

será utilizado. 

Discretização Não-Uniforme 

Neste caso, a discretização é feita de forma a delimitar tridimensionalmente os disposi- 

tivos imersos no substrato, de forma a obter a melhor separação entre zonas de materiais 

diferentes, eliminando à partida uma componente de erro. Na Figura 2.4 ilustra-se o pro- 

cesso de discretização não-uniforme. 

Como se pode ver, não há paralelipípedos resultantes constituídos por diferentes ma- 

teriais, eles são homogéneos, o que conduz a uma mais correcta discretização do meio.


Discretização Não-Uniforme Adaptável 

Figura 2.4: Discretização não-uniforme. 

Este tipo de discretização baseia-se no princípio exposto em [25] de que a vizinhança 

dos contactos é uma zona em que o potencial por eles imposto varia mais rapidamente e, 

como tal, exige uma maior discretização. 

Dado ser necessário um elevado número de cortes para serem visíveis as características 

específicas deste tipo de discretização, apresentam-se na Figura 2.5 uma vista de topo e 

uma vista lateral da discretização de uma configuração com dois contactos de iguais di- 

mensões, um ao lado do outro. 

200 

180 

160 

140 

120 

100 

80 

60 

40 

20 

0 

0 50 100 150 200 250 

100 

90 

80 

70 

60 

50 

40 

30 

20 

10 

0 

0 50 100 150 200 250 

(a) (b) 

Figura 2.5: Vistas de topo (a) e lateral (b) da discretização adaptável. Unidades em µm. 

Como se pode ver na vista de topo, o interior dos contactos é discretizado uniforme- 

mente, enquanto que no seu exterior, existe uma maior concentração de cortes junto aos 

contactos, que diminui gradualmente até aos limites do substrato. 

Na vista lateral a zona com maior concentração de cortes revela a presença do fundo


i j 

Figura 2.6: Volumes resultantes da discretização do substrato. 

dos contactos, situada a 3 µm do topo. 

2.2.3 Simplificação do Modelo a Resolver 

Depois de discretizado todo o volume do substrato segundo o método das diferenças fini- 

tas, obtém-se uma estrutura de paralelipípedos interligados da forma que se apresenta na 

Figura 2.6. 

O centro de cada paralelipípedo é considerado um nó da malha tridimensional que 

modela o substrato. 

De modo a resolver o modelo eléctrico que interliga cada nó a um outro a ele adja- 

cente, podem aplicar-se as Leis de Maxwell, nomeadamente a lei 2.1, na forma simplifi- 

cada 2.8. Uma forma intuitiva de chegar a esta equação pelo método das diferenças finitas 

é exposta de seguida. 

Aplicando a lei de Gauss a um volume V que envolva um nó da rede tridimensional 

obtém-se: 

∇E dV¡ 

V 

 

V 

y 

x 

ρ 

ε 

z 

dV (2.9) 

Segundo o teorema da divergência pode reduzir-se o problema à superfície do parale- 

lipípedo que contém o nó ficando: 

E dS¡ 

Si 

 

V 

ρ 

ε 

dV (2.10) 

Considerando as propriedades de homogeneidade dentro de cada camada do substrato, 

o lado direito da equação mantém-se constante. Sendo Ei j o campo eléctrico normal ao


lado do paralelipípedo entre o nós i e j, Si j, tem-se: 

∑ j 

Ei jSi j¡ρ 

ε Vcubo 

em que Vcubo representa o volume do paralelipípedo. 

Voltando à equação de Gauss, tem-se 

∇E¡∑ j Ei jSi j 

Vcubo 

O campo eléctrico Ei j pode ser calculado aproximadamente pela seguinte equação: 

Ei j¡ViVj 

li j 

(2.11) 

(2.12) 

(2.13) 

em que li j é a distância entre o nó i e o nó adjacente j. Utilizando esta igualdade na 

Equação 2.12 obtém-se a seguinte expressão alternativa para a Equação 2.8: 

onde Gi j¡σ Si j 

li j e Ci j¡ε Si j 

li j . 

∑ j¢ViVj¤Ci j¢∂Vi 

(2.14) 

jGi 

∂t∂Vj ∂t¤¡0 

Esta equação reflecte um modelo de ligação resistiva e capacitiva entre cada par de 

nós adjacentes na rede tridimensional. 

Se for assumido que o tempo de relaxação do substrato é desprezável até frequências 

de trabalho de cerca de 10 GHz [15], pode ignorar-se a componente capacitiva deste 

modelo e modelar o substrato por uma rede tridimensional de resistências. 

A Equação 2.14 resulta da discretização do operador de gradiente do campo eléctrico 

e é coerente com a fórmula 2.8 obtida anteriormente. 

2.2.4 Considerações Sobre o Acoplamento Capacitivo do Substrato 

Além das propriedades capacitivas intrínsecas ao semicondutor que constitui o substrato 

propriamente dito, e que neste trabalho foi desprezado como foi exposto na secção ante- 

rior, existem outros elementos parasitas capacitivos relevantes no estudo do acoplamento 

pelo substrato. 

Na seguinte Figura 2.7 estão representadas as capacidades parasitas, sem as quais, em 

regime AC, não existiria acoplamento pelo substrato. Estas capacidades encontram-se


p+ n+ n+ p+ p+ n+ 

substrato-p 

R C R C C R C R 

poço-n 

Figura 2.7: Elementos capacitivos relevantes no acoplamento pelo substrato. 

entre difusões ne o substrato p e entre difusões pe o poço n, acontecendo o análogo 

no caso de tecnologias complementares. 

Além das capacidade que ligam as difusões dos transístores aos poços ou substrato, 

existem as capacidades que fazem o acoplamento entre os poços e o substrato. É através 

destes últimos elementos capacitivos que variações de tensão induzidas do interior dos 

poços influenciam o volume circundante do substrato e vice-versa. 

Em relação aos contactos de polarização e canais dos transístores, a sua influência 

manifesta-se no substrato através da injecção de corrente, de forma resistiva, dado que se 

tratam de junções entre materiais do mesmo tipo. 

Noutros trabalhos é feita a aproximação de que a injecção de corrente por um transístor 

se faz por toda a zona das duas difusões e do canal. A justificação para este facto é que 

o canal está formado a maior parte do tempo e é por ele que flui grande parte da corrente 

para o substrato relativa a esse transístor. No entanto, neste trabalho não se fez essa 

aproximação. Considera-se que o transístor é constituído por duas difusões de injecção 

independente e que o canal não é elemento interveniente do acoplamento. 

Estes são os elementos considerados neste trabalho como intervenientes no acopla- 

mento pelo substrato: 

Contactos de polarização pe n(injecção resistiva); 

Difusões pe n(injecção capacitiva). 

As capacidades parasitas entre difusões e substrato, entre difusões e poços e entre 

poços e substrato, são necessariamente extraídas por outra ferramenta. 

O modelo resistivo obtido pela ferramenta de software desenvolvida neste trabalho 

deve ser ligado ao modelo capacitivo, obtido pela ferramenta externa, que faz a ponte 

C

2.3. EXTRACÇÃO DO MODELO DO SUBSTRATO 15 

entre o substrato em si e os dispositivos nele implantados. O modelo conjunto permitirá 

simular os efeitos de acoplamento pelo substrato e testar o funcionamento do circuito em 

análise. 

2.3 Extracção do Modelo do Substrato 

Tal como foi dito, de forma a simplificar o modelo a extrair assume-se que a frequência de 

operação dos dispositivos implantados sobre o substrato vai apenas até cerca de 10 GHz. 

Desta forma, o tempo de relaxação do substrato é desprezável e podem ser desprezadas 

as capacidades intrínsecas do mesmo. 

Dado aquilo que foi exposto, os poço são considerados como fronteiras de Dirichelet 

– há diferença de potencial, mas não fluxo de corrente de ou para o seu interior – e, como 

tal, é como se não fizessem parte do problema a resolver. No que diz respeito a difusões 

dentro de poços, o algoritmo de extracção do modelo deve ser aplicado individualmente 

para cada poço, de modo a obter a interacção resistiva entre as difusões implantadas em 

cada um desses poços. 

Tem-se então que o sistema a resolver se pode representar sob a forma 

Vg¡ZgIg 

(2.15) 

em que Vg é o vector de tensões de todos os pontos resultantes da discretização, Ig o vector 

de correntes injectadas nesses pontos e Zg a interacção, neste caso, resistiva, entre todos 

os pontos da grelha. No entanto, o objectivo da ferramenta proposta é fornecer um modelo 

de interacção entre contactos ao substrato e não entre pontos da grelha de discretização. 

A forma como esse modelo de acoplamento é obtido é exposta na secção seguinte. 

2.3.1 Método de Extracção do Modelo 

O modelo que se pretende obter está ilustrado na Figura 2.8. Este modelo pode ser descrito 

sob a forma matricial:


backplane 

Figura 2.8: Modelo de acoplamento. 

Y13 

Yc¡ 

Y11 Y21 

Y12 

Y22 Y23 

Y31 Y32 Y33 

(2.16) 

em que Yii representa a impedância entre o contacto i e a massa (backplane), caso exista, 

e Yi j a impedância entre o contacto i e o contacto j. 

Pode escrever-se o sistema de equações relativo ao problema de acoplamento entre 

contactos da seguinte forma: 

Ic¡YcVc 

(2.17) 

em que Ic é o vector de correntes injectadas nos contactos, Yc a matriz de admitâncias 

(condutâncias) que interligam os contactos e Vc o vector de tensões dos contactos. A 

forma de como, a partir do sistema 2.15 se vai construindo a matriz Yc será de seguida 

apresentada. 

Se se escrever o sistema 2.15 sob a forma de admitâncias, e agrupando as equações 

relativas aos nós dos contactos, fica-se com: 

(2.18) 

Ic Ii Yic Yii 

em que os índices c se referem a nós dos contactos e os índices i a nós fora dos contactos. 

¡ Ycc Yci 

Vc Vi 

Sabendo que apenas os nós dos contactos têm tensões impostas, pelo equivalente de 

Norton só os nós a eles adjacentes sofrem injecção de corrente, pelo que Ii¡0. Fica-se


então com: 

Ic 

0 

Resolvendo em ordem a Ic obtém-se: 

¡ Ycc Yci 

Yic Yii 

Vc Vi 

Ic¡¢YccYciY1 ii Yic¤Vc 

Sendo que a matriz de condutâncias que relaciona os contactos é: 

Gc¡YccYciY1 

ii Yic 

(2.19) 

(2.20) 

(2.21) 

No entanto, a inversão de Yii tem, como se sabe, uma complexidade de O¢N 3¤no caso 

de matrizes densas e uma complexidade de O¢N 2¤no caso de matrizes esparsas, pelo que 

é ineficiente realizá-la. 

Em vez disso, procede-se ao cálculo de uma coluna de Gc de cada vez. Colocando a 

tensão de um contacto x a 1V e a tensão de todos os outros contactos a 0V pode calcular- 

se pelo equivalente de Norton as correntes injectadas nos nós adjacentes aos contactos, 

preenchendo alguns elementos de Ii, e eliminar-se do sistema todos os nós cujo potencial 

é conhecido (nós dos contactos). Fica-se então com o sistema: 

Ii¡YiiVi 

(2.22) 

Resolvendo este sistema obtêm-se o valores de tensão de todos os nós que não per- 

tencem aos contactos, Vi. Sabendo isto, podem calcular-se as correntes que entram em 

cada um dos contactos, Ic, pela lei de Ohm. Resta então resolver o sistema: 

Ic¡GcVc 

Como já se conhece Ic e se colocou apenas os nós do contacto x a 1V tem-se: 

(2.23)


Ic1 

. 

Icx 

. 

¡Gc 

Vc1 

. 

Vcx 

 

 

. 

 

Icm 

Vcm 

Deste sistema resulta que o vector Ic calculado com o contacto x a 1V corresponde à 

coluna x da matriz Gc. 

. 

¡Gc 

0 

. 

1 

0 

(2.24) 

Repetindo este processo para todos os contactos constrói-se a matriz Gc (ou Yc) na to- 

talidade. Uma das desvantagens deste método é ter que resolver o sistema tridimensional 

tantas vezes quanto o número de contactos existentes no substrato. 

2.3.2 Matriz do Sistema de Equações a Resolver 

Foi dito na secção anterior que para o cálculo de cada uma das colunas de Yc se tem 

que resolver o sistema (2.15). Este sistema corresponde electricamente a uma rede tridi- 

mensional de resistências (ou impedâncias) interrompida por pontos que impõem tensão 

(pertencentes ao contacto colocado a 1V) e pontos que absorvem corrente (pertencentes 

aos restantes contactos e/ou ao backplane). Os poços, como já foi referido, actuam como 

barreiras à passagem de corrente e é como se não existissem. 

A numeração adoptada para os nós da rede tridimensional de resistências obedece à 

sequência indicada na Figura 2.9 

É fácil de observar que a matriz correspondente à rede tridimensional de impedâncias, 

Zg, só tem algumas diagonais preenchidas. Isto, porque cada ponto da grelha só está 

ligado aos pontos adjacentes. Cada ponto i, no caso geral, dispõe das ligações que se 

podem observar na Figura 2.10. 

Para um substrato com m cortes na direcção x, n cortes na direcção y e d cortes na 

direcção z temos uma matriz de mnd mnd. As diagonais da matriz Zg que se encontram 

preenchidas são: a diagonal principal, as diagonais à distância 1 da diagonal principal, as 

diagonais à distância m da diagonal principal e as diagonais à distância mn da diagonal 

principal. A matriz Zg é, portanto, uma matriz simétrica com 7 diagonais. 

De uma forma mais pormenorizada, o sistema tridimensional a resolver toma a seguinte


y 

x 

... ... ... ... ... 

2m+1 2m+2 2m+3 ... 3m 

m+1 m+2 m+3 ... 2m 

1 2 3 ... m 

mn+m+1 mn+m+2 mn+m+3 

z ... 

mn+1 mn+2 mn+3 

mn-m+1 mn-m+2 mn-m+3 ... mn 

... 

mn+m 

Figura 2.9: Esquema de numeração dos nós. 

i-1 i 

i+1 

i-m 

i-mn 

i+mn 

i+m 

Figura 2.10: Esquema de ligações entre nós.


forma matricial: 

Z1m1 Z1mn1 

Vg¡ Z12 Z11 Z21 Z22 Z23 Z2m2 Z2mn2 

. .. 

. .. 

. .. 

Na Figura 2.11 pode visualizar-se a estrutura da matriz de sistema. 

0 +1 +m +mn 

-1 

-m 

-mn 

2.4 Trabalho Prévio 

. .. 

Figura 2.11: Estrutura da matriz de sistema. 

. .. 

Ig (2.25) 

No passado, diversas metodologias de abordagem do problema exposto foram propostas 

por vários autores. Todas elas têm como objectivo comum fornecer modelos que permi- 

tam uma simulação eficiente do circuito integrado em análise. As mais simples consistem 

na utilização de regras heurísticas para tentar prever os acoplamentos mais relevantes pe- 

lo substrato e com base nelas gerar um modelo simplificado do mesmo [12, 19, 20, 21]. 

Estas técnicas têm a seu favor o facto de terem um custo de aplicação reduzido. No entan- 

to, como esses modelos se baseiam em heurísticas, não são muito fiáveis, especialmente 

para problemas de configuração mais complexa, e podem chegar a produzir soluções com 

um erro superior a 50%. Outro dos problemas relativos a estas técnicas são o facto de 

fornecerem modelos de primeira ordem úteis apenas para o projectista. Devido à sua sim- 

plicidade, estes modelos são demasiado rudimentares para serem incorporados em simu- 

ladores que verifiquem com precisão o funcionamento do circuito. O que acontece com 

as técnicas heurísticas, é que elas negligenciam completamente os efeitos de acoplamento

2.4. TRABALHO PRÉVIO 21 

de segunda ordem e podem concluir que um circuito não têm problemas de acoplamento, 

quando, efectivamente, não é o caso. 

Por outro lado, existem abordagens ao problema em que é analisado em detalhe o 

comportamento electromagnético do substrato e que fornecem um modelo bastante com- 

pleto dos acoplamentos. Exemplos de ferramentas desse tipo são: Depict, Davinci, Medi- 

ci (Pisces [23]), Fielday II, etc. Como se tratam de simuladores de dispositivo, este tipo 

de ferramenta é demasiadamente lento, pois simula com exactidão os fenómenos de deri- 

va dos semicondutores, ao passo que o resultado final que se pretende é apenas de nível 

eléctrico. Isto implica que estas ferramentas não tenham aplicabilidade prática em fluxos 

de projecto convencionais, até porque dada a sua complexidade permitem apenas a análise 

de porções de circuito com um número muito reduzido de dispositivos. 

Um outro tipo de métodos que tem sido aplicado com sucesso na abordagem do pro- 

blema em questão, são os Métodos dos Elementos Fronteira (Boundary Element Meth- 

ods, BEM) [5, 6, 7, 11, 14, 24]. Estes métodos requerem apenas a discretização su- 

perficial dos contactos de acoplamento, pelo que dão origem a matrizes de reduzida di- 

mensão, mas densas, e exigem uma computação intensiva, o que limita a aplicação destes 

métodos a problemas de pequena e média dimensões. Nos últimos anos tem-se assistido 

ao surgimento de métodos de aceleração das computações exigidas pelos métodos BEM 

[5, 6, 7, 8, 10, 11, 24, 25]. 

Os Métodos de Elementos Finitos (Finite Element Methods, FEM) e Métodos de 

Diferenças Finitas (Finite Difference Methods, FDM), por sua vez, são métodos que se ba- 

seiam, respectivamente, na discretização de todo o volume do substrato e na discretização 

de uma formulação com base em equações diferenciais [2, 21, 15, 26]. Como tal, con- 

duzem a matrizes de grande dimensão, mas esparsas. A resolução dos sistemas relativos a 

estas matrizes, quando aliada a algoritmos apropriados, fazem dos métodos FEM e FDM 

métodos competitivos. 

De seguida, apresenta-se um breve historial dos avanços que têm vindo a ser realizados 

nesta área de investigação na última década. 

Em 1993, Su et al. [19] experimentaram várias técnicas com vista à redução do acopla- 

mento pelo substrato, tais como a separação física entres as partes analógica e digital, o 

uso de guard rings e a utilização de métodos de polarização do substrato de baixa indução.


A sua conclusão foi que destas três técnicas a última era a mais eficaz na redução do 

acoplamento entre os blocos analógico e digital. Concluíram também que, em substratos 

com camadas epitaxiais, quando as linhas de força alcançam a camada base do substrato 

elas se espraiam por todo o circuito. Caso os blocos analógico e digital estejam separados 

por cerca de quatro vezes a espessura da camada epitaxial, o acoplamento ocorre princi- 

palmente pela camada base do substrato e o aumento da separação dos blocos não diminui 

o acoplamento. Por outro lado, em substratos levemente dopados a separação física e os 

guard rings são métodos eficazes de redução do acoplamento. Neste mesmo trabalho, 

foram ainda realizadas simulações eléctricas em que foi usado um modelo empírico para 

o cálculo da resistência entre os contactos e o substrato. 

Em 1994, Clement et al. [2] desenvolveram uma ferramenta de software, o LAYIN, 

capaz de apresentar um modelo do acoplamento pelo substrato ao mesmo tempo que per- 

mitia a visualização das respectivas linhas de força sobre o layout do circuito analisado. 

O modelo extraído por esta ferramenta era puramente resistivo e compreendia o substra- 

to e os poços interligados por elementos capacitivos. Este modelo, muito semelhante ao 

utilizado no presente trabalho, foi comparado com a ferramenta MEDICI e revelou uma 

boa precisão para frequências de trabalho até à ordem dos GHz. Em termos de desem- 

penho, o LAYIN era mais de 1000 vezes mais rápido que ferramentas como o MEDICI e 

o SUPREM (simuladores de dispositivo), e apresentava erros inferiores a 10%. 

No mesmo ano, Joardar [26] apresenta um estudo comparativo entre técnicas de trench- 

ing e de guard rings. A sua conclusão foi de que para frequências mais elevadas, que é 

o caso de interesse actualmente, as primeiras não oferecem vantagem sobre as segundas. 

Além disso, um isolamento por guard rings do tipo pnão é sensível à frequência de 

trabalho e pode ser a única técnica de isolamento eficaz para alta frequência. 

Ainda no mesmo ano, Stanisic, Verghese et al. [15] apresentam uma ferramenta in- 

dependente do processo de fabrico do circuito integrado em análise, eficiente e precisa. 

O presente trabalho baseia a sua formulação do modelo do substrato neste artigo. Os re- 

sultados obtidos por esta ferramenta foram validados por experiências e apresentam uma 

mais-valia em termos de tempo de execução. 

Em 1995 surgiu o Space, uma ferramenta por Smedes et al. [11] baseada numa 

formulação BEM, mas com a discretização baseada em funções de Green. O modelo


obtido é sujeito a uma redução de ordem, com vista à obtenção de um modelo mais sim- 

ples, ainda que preciso. O Space comporta uma complexidade temporal linear e revela 

uma ocupação de memória praticamente independente da complexidade do problema. 

Para colmatar uma das falhas dos extractores desenvolvidos até então, que têm aplicação 

em apenas zonas delimitadas do layout de um circuito, a equipa do projecto Space desen- 

volveu uma nova versão da ferramenta [12], destinada à análise de circuitos de grande 

dimensão. Esta nova aproximação já não se baseia em discretização (métodos BEM), 

mas sim no cálculo semi-empírico das resistências de acoplamento entre contactos sufi- 

cientemente próximos. A decisão de se os contactos são próximos ou não é obtida através 

da triangulação de Delaunay [27]. Depois de decidir que resistências extrair, o método 

calcula-as por interpolação de valores de resistências obtidas à priori, em regime experi- 

mental. 

No mesmo ano ainda, Mitra et al. [21] apresentam igualmente uma metodologia de 

obtenção de modelos simplificados, em que se troca, tal como na segunda versão do 

Space, a precisão do modelo por eficiência de extracção. 

Outras formas de obter modelos simplificados do acoplamento pelo substrato, nomeada- 

mente através de técnicas de decisão de proximidade, como a tesselação de Voronoi 1 , 

foram apresentadas em [28]. 

Em 1997, Costa et al. [5, 6, 7] fizeram avanços no domínio dos métodos BEM para 

análise do acoplamento pelo substrato, aplicando uma técnica rápida de decomposição de 

valores próprios e, posteriormente, uma extensão a essa técnica através do uso de técnicas 

de DCT pré-corrigida. Os resultados obtidos revelam o dispêndio de alguma precisão do 

resultado em troca de um aumento da eficiência de extracção, possibilitando a aplicação 

do método a circuitos com algumas centenas de contactos. 

Em 1998, Mike Chou e Jacob White [8] apresentam um novo método iterativo basea- 

do em Multigrid que mostrou convergir mais rapidamente que os métodos de Krylov 

anteriormente utilizados. O método proposto assentava numa discretização do tipo BEM. 

Ainda em 1998, Charbon et. al [29] propõem uma metodologia de comparação de 

métodos de extracção de modelos do substrato. 

Em 2000, Silveira e Vargas [31] apresentam um método de extracção baseado em 

1 É de notar que a tesselação de Voronoi é, em termos geométricos, o dual da triangulação de Delaunay.


FEM, cujos resultados experimentais permitem antever a eficiência de métodos Multi- 

nível na resolução de sistemas resultantes da formulação FEM aplicado à modelação do 

substrato. O presente trabalho é a materialização numa ferramenta de extracção de tais 

métodos. 

Em 2001, Amaro et. al [32] apresentam uma framework de análise de efeitos de 

acoplamento pelo substrato, que permite testar diversas ferramentas de extracção, bem 

como analisar o efeito de diferentes configurações do layout, utilização de guard-rings e 

tecnologias diferentes, no acoplamento pelo substrato. 

No mesmo ano, Phillips e Silveira [22] apresentam uma aproximação ao problema de 

acoplamento em que obtêm uma redução de ordem do modelo obtido através da supressão 

ponderada de resistências menos relevantes. 

Também em 2001 Brandtner e Weigel [33] apresentam um método de simulação hi- 

erárquica do problema do acoplamento, em que procedem à co-simulação das pistas de 

alimentação, mas esta abordagem não permite a presença de poços nem a aplicação a 

circuitos de grande dimensão. 

Ainda em 2001 Kanapka et al. [10] apresentam uma forma de calcular eficazmente 

uma matriz de acoplamento esparsa, através da eliminação cuidadosa de acoplamentos 

de valor negligenciável. Foi usada uma metodologia FDM em que se resolveu o sistema 

obtido através do método PCG. 

Já em 2002 surge o HSpeedEx, por Koukab et al. [3], em que se apresenta uma nova 

abordagem. O acoplamento entre blocos de um circuito é tratado de diferente forma do 

acoplamento interno a um bloco do circuito. O método é baseado nos BEM, mas de modo 

a reduzir a memória necessária pelas matrizes densas que este tipo de métodos acarreta, 

este método foi modificado, de modo a tratar-se de diferente forma o acoplamento inter- e 

intra-bloco. Devido a esta modificação o HSpeedEx é uma das ferramentas mais eficientes 

(quer em tempo de execução quer em memória necessária) e simultaneamente precisas 

existentes. 

Por último, a equipa do projecto Space surge com algo que seria intuitivo esperar: 

um método híbrido BEM/FEM. Neste novo método, o acoplamento através de camadas 

epitaxiais entre os contactos é extraído por um método FEM, enquanto que as resistências 

de acoplamento dos contactos para o backplane são extraídas por um método BEM. Por


combinar a eficácia do FEM com a eficiência do BEM, este é também um dos melhores 

métodos de extracção disponíveis actualmente.

26 CAPÍTULO 2. MODELAÇÃO DOS ACOPLAMENTOS PELO SUBSTRATO

Capítulo 3 

Métodos de Resolução do Sistema de 

Equações 

Os métodos de utilização possível na resolução do sistema de equações que resulta da 

discretização do substrato dividem-se em dois grupos: métodos directos e métodos itera- 

tivos. Os métodos directos fornecem uma solução exacta (à precisão da máquina), mas são 

geralmente muito ineficientes para problemas de complexidade elevada. Por outro lado, 

os métodos iterativos, para os quais a solução exacta é por vezes inatingível, permitem a 

obtenção relativamente eficiente de um solução de precisão especificável. 

Nas próximas secções serão apresentados e analisados alguns métodos pertencentes a 

estes dois grupos. Embora o Multigrid se insira dentro do conjunto de métodos iterativos, 

dada a ênfase que lhe foi dada neste trabalho, ele será descrito e analisado em detalhe no 

próximo capítulo. 

3.1 Métodos Directos 

Os métodos de resolução directa mais conhecidos são o método de eliminação de Gauss 

e o método de eliminação de Gauss-Jordan. Enquanto que o método de Gauss consta 

da eliminação da parte triangular inferior da matriz e de uma substituição ascendente, 

no método de Gauss-Jordan faz-se a eliminação da parte triangular inferior e depois a 

eliminação da parte triangular superior, obtendo-se uma matriz diagonal que permite 

então a resolução imediata do sistema. Prova-se [39] que a complexidade do método 

27

28 CAPÍTULO 3. MÉTODOS DE RESOLUÇÃO DO SISTEMA DE EQUAÇÕES 

de eliminação de Gauss-Jordan é de, pelo menos, 15 vezes superior à do método de 

eliminação de Gauss. 

Dada a relativa inutilidade destes métodos face ao problema que se pretende resolver, 

será somente apresentado o método de eliminação de Gauss, de forma a ilustrar a forma 

directa de resolver o problema. 

3.1.1 Método de Eliminação de Gauss 

Dado o sistema Ax¡b, mais especificamente representado por 

a11 a12 

a21 a22 

. 

. 

aN1 aN2 

x1 a1N 

a2N 

. .. 

. 

aNN 

x2 

. 

xN 

b2 

. 

¡ b1 

bN 

(3.1) 

o método de eliminação de Gauss [39] comporta N1 passos de eliminação e N passos de 

substituição ascendente. Como a complexidade do processo de eliminação impera sobre 

a complexidade do processo de substituição ascendente, é suficiente analisar o primeiro. 

No passo k da eliminação de Gauss fazem-se uma divisão, Nk multiplicações e Nk 

adições. A complexidade deste método para matrizes densas é de O¢N 3¤[34, 39]. 

Para o caso específico de matrizes de apenas 7 diagonais a complexidade é menor, mas 

não se pode assumir que se têm somente 7 elementos em cada linha. Há que considerar 

o surgimento de fill-ins no decorrer do processo de eliminação. Os fill-ins são elementos 

não nulos que surgem em posições anteriormente ocupadas por elementos nulos quando 

se adiciona a linha de pivot com a linha que se pretende eliminar. 

No caso da grelha resistiva do substrato, a matriz de sistema antes e depois do pro- 

cesso de eliminação de Gauss apresenta-se na Figura 3.1. Como se pode ver, no caso 

representado pela figura — correspondente a uma discretização de 9 9 5 —, o número 

de elementos não nulos aumenta de 2429 (¦9 9 5 7) para 51937 durante o processo 

de eliminação. 

Para uma grelha de mnd mnd a largura da banda da matriz da Figura 3.1 (b) é da 

ordem de mn. Designando por N¡mnd a dimensão do sistema, tem-se os seguintes 

números de operações aritméticas:

3.1. MÉTODOS DIRECTOS 29 

0 

50 

100 

150 

200 

250 

300 

350 

400 

0 50 100 150 200 

nz = 2429 

250 300 350 400 

0 

50 

100 

150 

200 

250 

300 

350 

400 

0 50 100 150 200 

nz = 51937 

250 300 350 400 

(a) (b) 

Figura 3.1: Matriz de sistema antes (a) e depois (b) do processo de eliminação de Gauss. 

Divisões: N1 

∑ 

k1¢mn¤¡¢N1¤mn 

Multiplicações: N1 

∑ 

k1¢mn¤2¡¢N1¤¢mn¤2 

Adições 1 : N1 

∑ 

k1¢mn¤2¡¢N1¤¢mn¤2 

No caso particular em que m¡n¡d¡3N tem-se: 

Número de divisõesn 5 

Número de multiplicaçõesn 7 

Número de adiçõesn 7 

pelo que a complexidade de tempo associada à eliminação gaussiana é dominada pelos 

números de multiplicações e adições e tem o valor de O¢n7¤¡O¢N 73¤. É de notar que 

nesta análise não se considerou a possibilidade de reordenar as linhas de A de forma a 

reduzir o número de fill-ins gerados. Existem técnicas em que isso é feito com base no 

critério de Markowitz e que resultam numa complexidade temporal para o método de 

eliminação de Gauss de O¢N 2¤. 

1 Em termos computacionais as subtracções são adições com o simétrico de um dos operandos.


Em termos de requisitos de memória, a estrutura mais relevante é a matriz A depois 

de factorizada (Figura 3.1 (b)), ocupando aproximadamente mn ¢mndmn¤m 2 n 2 d 

elementos. 

3.2 Métodos Iterativos 

Os métodos iterativos, ao contrário dos métodos directos, trocam uma solução exacta, 

que, em termos práticos, é dispensável, por uma solução com uma precisão especificável. 

Estes métodos obtêm uma solução muitas vezes satisfatória num número de iterações 

bastante inferior à dimensão da matriz do problema. 

De seguida são apresentados os métodos iterativos com os quais, neste trabalho, foram 

comparados os algoritmos desenvolvidos (Multigrid, Full Multigrid e Multigrid Precon- 

ditioned Conjugate Gradient), descritos no próximo capítulo. 

No apêndice B faz-se a análise detalhada do número de operações e dos requisitos de 

memória dos métodos iterativos. 

3.2.1 Métodos de Relaxação 

Neste ponto, convém introduzir os conceitos de função de erro e suas componentes de 

alta e baixa frequências. A função de erro relativa à iteração k de um método iterativo é 

dada por: 

ek¡xkˆx (3.2) 

em que ˆx é o valor exacto da solução do problema e xko vector solução na iteração k. 

Na Figura 3.2 apresenta-se um exemplo abstracto de uma função espacial de erro 

segundo a direcção x, juntamente com as suas componentes de alta e baixa frequências. 

Os métodos de relaxação apresentados nesta secção podem ser usados para resolver o 

sistema de equações, mas, dada a sua dificuldade em eliminar as componentes de baixa 

frequência do erro (Figura 3.2 (b)), são normalmente usados como uma forma rápida de 

suavizar a função de erro, i.e., de eliminar a sua componente de alta frequência (Figura 

3.2 (c)).

3.2. MÉTODOS ITERATIVOS 31 

e(x) 

(a) 

(b) 

(c) 

Figura 3.2: Função de erro (a) e suas componentes de alta (b) e baixa (c) frequências. 

x


Método de Jacobi 

No sistema 3.1 tem-se para a equação i: 

que, resolvido em ordem às incógnitas, fica: 

n 

∑ ai jxj¡bi 

j1 

xi¡bi∑ ji 

ai jxj 

aii 

(3.3) 

(3.4) 

O método de Jacobi [36] consiste no cálculo independente de cada uma das incógnitas 

através da seguinte fórmula iterativa: 

¡bi∑ ji ai j 

i 

aii jxk1 

xk 

Em notação matricial tem-se para este método a expressão 

(3.5) 

(3.6) 

em que L é a parte triangular inferior de A, U a sua parte triangular superior e D a diagonal 

xk¡D1b¢LU¤xk1 

principal, ou seja, A¡LDU. 

O cálculo com maior peso computacional é a multiplicação matriz-vector,¢LU¤x. 

Como a matriz LU tem apenas 6 diagonais, no presente caso, a complexidade por 

iteração deste algoritmo é de O¢6N¤O¢N¤. A complexidade total é de O¢N¤vezes o 

número de iterações. 

Em termos de requisitos de memória há que reservar espaço para as matrizes L, D 

e U, ou seja, para a matriz A, que consta de 7N elementos. Ao contrário do método de 

eliminação de Gauss, neste método não se faz a eliminação da matriz de sistema, pelo que 

não há criação de fill-ins. 

Método de Gauss-Seidel 

Considerando que cada equação do sistema 3.1 é analisada sequencialmente, sendo o 

resultado utilizado assim que estiver disponível, obtém-se o método de Gauss-Seidel, 

representado pela seguinte equação


¡bi∑ ji ai 

i jxk 

xk 

∑ j ji ai j jxk1 

Em termos matriciais, este método pode representar-se da seguinte forma: 

aii 

(3.7) 

(3.8) 

A matriz LD é triangular inferior e, como tal, a sua multiplicação pelo resto da 

xk¡¢LD¤1¢bUxk1¤ 

expressão corresponde a um processo de substituição ascendente, pois trata-se de resolver 

o sistema¢LD¤xk¡bUxk1. O passo mais pesado em termos computacionais é 

a multiplicação matriz-vector Ux, pelo que a complexidade por iteração do algoritmo 

é também de O¢N¤. Novamente, a complexidade total é de O¢N¤vezes o número de 

iterações. 

Tal como no método anterior, a estrutura que ocupa mais memória é a matriz A (7N 

entradas). 

Método de Sobre-Relaxação Sucessiva, SOR 

Este método é extrapolado do método de Gauss-Seidel e consta numa média pesada (por 

um factor ω) entre o valor da iteração anterior e o valor da iteração de Gauss-Seidel actual, 

isto é, 

em que i é a iteração de Gauss-Seidel. 

xk 

i i i ¢1ω¤xk1 ¡ωxk xk 

Sob a forma de operações de matrizes tem-se: 

(3.9) 

(3.10) 

Se o peso ω for constante têm-se as seguintes operações: 

xk¡¢ωLD¤1ωbωU¢1ω¤Dxk1 

matriz-vector,ωU¢1ω¤Dxk1 multiplicação 

subtracção de vectores, ωbωU¢1ω¤Dxk1 

substituição,¢ωLD¤1 ωbωU¢1ω¤Dxk1


pelo que se conclui, novamente, que a complexidade computacional por iteração deste 

algoritmo é de O¢N¤, devida à multiplicação matriz-vector, sendo a complexidade total 

de O¢N¤vezes o número de iterações. 

Se ω não for constante, i.e., se ω se adaptar à evolução da norma resíduo,¥r¥¡ 

do 

¥bAx¥, há que acrescentar a estes cálculos a multiplicação da constante ω pelas estru- 

turas de matrizes e vectores, o que torna este método bastante dispendioso. 

No caso do SOR há que reservar memória para a matriz A, que corresponde a 7N 


Os três métodos de relaxação anteriormente apresentados definem uma sequência de 

iterações sob a forma: 

xk1¡Gxkf (3.11) 

em que G é a matriz de iteração. A convergência destes métodos depende do raio espectral 

desta matriz de iteração. O raio espectral de uma matriz A é dado por: 

(3.12) 

em que λi é o i-ésimo valor próprio de A. 

ρ¢A¤¡maxλi£i¡1N 

Em [37] mostra-se que estes métodos de relaxação convergem se ρ¢G¤¦1. No en- 

tanto, quanto mais próximo da unidade for o raio espectral da matriz de iteração, menor é 

a taxa de convergência do respectivo método. 

Na Tabela 3.1 mostra-se a evolução do raio espectral da matriz de iteração do método 

de Gauss-Seidel à medida que se aumenta a complexidade da discretização. Para este 

método, G¡¢LD¤1 U. 

Pelo que foi exposto, verifica-se que com o aumento da complexidade do problema, 

a convergência do método de Gauss-Seidel se vai degradando rapidamente. Um efeito 

semelhante verifica-se para os outros dois métodos de relaxação apresentados. 

Na iteração k, o erro ekpara este tipo de métodos é dado por: 

ek¡Gek1¡G k (3.13) 

e0


Discretização 

5 5 3 0.9882048 ρ¢G¤ 

9 9 5 0.9912567 

17 17 9 0.9941415 

33 33 17 0.9974487 

Tabela 3.1: Evolução do raio espectral da matriz de iteração de Gauss-Seidel consoante a 

complexidade do problema. 

Pelo que se pode observar pela Tabela 3.1 o valor próprio próximo da unidade começa 

a dominar os outros e a potência G k tende para 1, o que faz com que o método tenha 

tendência a estagnar. 

Na Figura 3.3 apresenta-se um gráfico da evolução da norma do resíduo para os 

três métodos de relaxação apresentados. Os métodos foram testados sobre a extracção 

da resistência de um único contacto no centro do substrato para o backplane com uma 

discretização de 33 33 17. No método SOR usou-se um peso ω¡19, sendo o método 

que apresenta o melhor resultado global. No entanto, o SOR exige que se escolha ade- 

quadamente o peso ω, o que não é trivial. Valores ligeiramente diferentes de ω podem 

fazer com que o SOR deixe de ser globalmente melhor que os GS e Jacobi e passe a ser 

muito mais lento. Por exemplo, para um peso calculado pela fórmula ω¡ 

2 [36], 

11ρ 2 

em que ρ é uma estimativa do raio espectral da matriz jacobiana e que no exemplo em 

questão resulta num valor de ω¡1999454, obtém-se um número de 16384 iterações para 

o SOR! 

3.2.2 Métodos de Krylov 

Um método de Krylov, ou método de sub-espaço de Krylov, é um método em que se 

procura, por ortogonalização, uma solução no sub-espaço de Krylov, dado por 

em que N é a dimensão do sistema. 

N¢A£b¤¡spanb£Ab£A 2 b££A N1 

(3.14) 

b 

Os métodos de Krylov são garantidos convergir em N iterações (à precisão da máquina 

e a menos de erro numérico), mas apresentam, normalmente, para um número de iterações


Norma do Resíduo 

10 3 

10 2 

10 1 

10 0 

10 −1 

10 −2 

10 −3 

10 −4 

10 −5 

10 −6 

Jacobi 

GS 

SOR 

10 

0 50 100 150 200 250 

−7 

Número de Iterações 

Figura 3.3: Convergência dos Métodos de Jacobi, Gauss-Seidel e SOR. 

muito inferior a N, uma norma do resíduo suficientemente baixa. 

De seguida são apresentados dois conhecidos métodos de Krylov: o primeiro, o Gen- 

eralized Minimum Residual (GMRES), é mais robusto, dado que pode ser aplicado a 

sistemas com matrizes assimétricas, mas tem como desvantagem exigir uma maior quan- 

tidade de memória. Quanto ao segundo método, o Conjugate Gradient (CG), apenas 

aplicável a matrizes simétricas, é um método mais rápido, dado que toma partido da sime- 

tria da matriz. Na resolução do problema em questão, como a matriz de condutâncias é 

simétrica, antevê-se que o CG seja melhor que o GMRES. 

Algoritmo Generalized Minimum Residual, GMRES 

A dedução do algoritmo encontra-se detalhada em [36, 37, 38]. O seu pseudo-código 

apresenta-se em Algoritmo 1. 

O passo 4 em que eventualmente se faz o recomeço (restart) do algoritmo após m 

iterações constitui uma variante à versão mais simples do GMRES (em que este passo 

não é incluído). 

Os maiores custos computacionais por iteração são a multiplicação matriz-vector no 

passo 2a e a minimização final no passo 3. 

Este algoritmo exige a reserva de memória para as seguintes estruturas:


Algoritmo 1 GMRES, Generalized Minimum Residual 

1. Sejam: r0¡bAx0, β¡¥r0¥, v1¡r0β e Hm1m¡0 

m 

2. Para j¡1£2££m ou até convergir: 

(a) w j¡Av j 

(b) Para i¡1£2££j: 

i. hi j¡¦w 

ii. w j¡w jhi jvi 

j£vi§ 

(c) h j1j¡¥w j¥. Se h j1j¡0 então m¡j e segue para 3. 

(d) v j1¡w jh j1j 

3. ym¡miny¥βe1Hmy¥, xm¡x0Vmym 

4. Se a tolerância não estiver satisfeita faz x0¡xm e volta ao início. 

Sistema: matriz A, vector x, vector b 

Resíduo: vector r 

Vectores de ortogonalização: matriz Vm (contém os vectores v ao longo das iterações), 

vector w 

Matriz de Hessenberg: Hm 

Vector de minimização do resíduo: ym 

Como se pode ver, uma das desvantagens deste algoritmo é ter que reservar memória 

para guardar os vectores de ortogonalização resultantes de cada uma das iterações do 

algoritmo, pelo que os seus requisitos de memória podem ultrapassar largamente as 7N 

entradas relativas à matriz A. 

A complexidade por iteração do GMRES é de O¢N¤(dominada pela multiplicação 

matriz-vector).


Algoritmo Conjugate Gradient, CG 

O algoritmo CG é derivado em [36, 37, 38]. Este algoritmo é aplicável a matrizes 

simétricas e definidas positivas. Uma matriz quadrada A é definida positiva se e só se 

x T Ax§0, para qualquer vector x não nulo. O pseudo-código do CG é apresentado no 

Algoritmo 2. 

Algoritmo 2 CG, Conjugate Gradient 

1. Sejam: r0¡bAx0, p0¡r0 

2. Para j¡0£1££até 

convergir: 

r 

(a) α j¡ 

jr 

Ap jp j j 

(b) x j1¡x jα j p j 

(c) r j1¡r jα jAp j 

(d) β j¡r 

j1r 

r jr j j1 

(e) p j1¡r j1β j p j 

O cálculo computacionalmente mais dispendioso deste algoritmo é a multiplicação 

matriz-vector Ap . O custo do algoritmo será, portanto, de O¢N¤. 

Este algoritmo requer apenas o armazenamento das estruturas: 

Sistema: matriz A, vector x, vector b 

Resíduo: vector r 

Sentido de ortogonalização: vector p 

Produto Ap, por razões de eficiência 

Neste caso já não é necessário guardar os vectores de ortogonalização em cada uma 

das iterações, pelo que os requisitos de memória do CG são semelhantes aos dos métodos 

de eliminação gaussiana e de relaxação. 

Nos métodos de Krylov a convergência é determinada pelo número de condição da 

matriz de sistema. Uma matriz é bem condicionada se o seu número de condição for



5 5 3 666.5 

¢G¤ 

9 9 5 1560.8 

17 17 9 2216.2 

33 33 17 6342.9 (estimativa) 

Tabela 3.2: Evolução do número de condição da matriz de sistema consoante a complex- 

idade do problema. 

próximo da unidade. Por sua vez, o número de condição de uma matriz quadrada é dado 

por [40]: 

(3.15) 

Se A for simétrica¢A¤¡λmax 

λmin 

¢A¤¡¥A¥¥A1¥ . 

Na Tabela 3.2 apresenta-se a evolução do número de condição para a matriz A à me- 

dida que se vai aumentando o nível de discretização do problema. Como se pode ver pela 

tabela, é de esperar que o número de iterações dos métodos de Krylov aumente consoante 

a complexidade do problema. 

3.2.3 Métodos de Krylov Pré-Condicionados 

A técnica de pré-condicionamento dos métodos de Krylov consiste em resolver o sistema: 

M1 Ax¡M1 b (3.16) 

em vez do sistema usual, Ax¡b. A mais valia desta técnica é, escolhida conveniente- 

mente a matriz de pré-condicionamento M, obter uma nova matriz M1A que é melhor 

condicionada do que A. Ora, se M for uma aproximação de A, o produto de M1 por A 

resulta numa matriz quase diagonal e a resolução do sistema é quase imediata. 

A perícia está em escolher a matriz M convenientemente. Naturalmente, não é com- 

putacionalmente viável calcular a inversa de M, pelo que a implementação desta técnica 

de pré-condicionamento não envolve a inversão de M, mas sim a sua multiplicação por 

um vector, como veremos adiante.


Algoritmo Preconditioned Generalized Minimal Residual, PGMRES 

Este algoritmo encontra-se descrito em [36, 37, 38]. 

Algoritmo 3 PGMRES, Preconditioned Generalized Minimum Residual 

1. Sejam r0¡M1¢bAx0¤, β¡¥r0¥, v1¡r0β, Vm¡v1£v2££vmeHm uma 

de¢m1¤ matriz m. 

2. Para j¡1£2££m: 

(a) w¡M1 Av j 

(b) Para i¡1£2££j: 

i. hij¡¦w£vi§ 

ii. w¡whijvi 

(c) h 

(d) v j1¡wh j1j 

j1j¡¥w¥ 

ym¡miny¥βe1Hmy¥ 

3. 

4. xm¡x0Vmym 

5. Se a tolerância está satisfeita sai, senão volta ao ponto 1. 

Como se pode observar por comparação com o pseudo-código do GMRES, a única 

diferença que se verifica no PGMRES (Algoritmo 3) está no passo 2a, em que em vez 

de se calcular w¡Av j calcula-se w¡M1 Av j, por resolução do sistema Mw¡Av j. Isto 

garante uma melhor convergência se a matriz M for bem construída. 

Neste trabalho utilizou-se como matriz de pré-condicionamento do GMRES a matriz 

de factorização incompleta de Cholesky [36, 37, 38]. 

Algoritmo Preconditioned Conjugate Gradient, PCG 

O PCG, tal como o CG, só é aplicável a matrizes de sistema simétricas e definidas positi- 

vas. A derivação do CG para o PCG encontra-se em [37]. 

Em termos grosseiros, o custo do algoritmo PCG (Algoritmo 4) é novamente domina-


Algoritmo 4 PCG, Preconditioned Conjugate Gradient 

1. Sejam r0¡bAx0, z0¡M1 r0 e p0¡z0. 


(a) α¡ 

convergir: 

r 

jz 

Ap jp j j 

(b) x j1¡x jα j p j 

(c) r j1¡r jα jAp j 

(d) z j1¡M1 r j1 

(e) β j¡r 

j1z 

r jz j j1 

(f) p j1¡z j1β j p j 

do pela multiplicação matriz-vector Ap e pela solução do sistema do passo 2d. Neste sis- 

tema a matriz envolvida não é a matriz inicial, A, mas sim a matriz de pré-condicionamento, 

M, e é exactamente este o passo em que se insere a técnica de pré-condicionamento. 

No PCG introduz-se o vector z¡M1 r como sendo outro tipo de resíduo. No passo 

de pré-condicionamento do PCG (Algoritmo 4: 2d) faz-se a actualização deste novo tipo 

de resíduo e é neste passo que entra a matriz de pré-condicionamento escolhida. 

CG: 

Neste trabalho experimentaram-se três tipos de matriz de pré-condicionamento para o 

factorização incompleta de Cholesky, ICHCG 

pré-condicionamento de Jacobi, JCG 

pré-condicionamento pela matriz do método SOR, SORCG 

A factorização de Cholesky aplica-se a matrizes simétricas. A factorização incomple- 

ta de Cholesky obtém-se a partir das fórmulas de factorização de Cholesky, evitando, no 

entanto, a criação de fill-ins (daí a designação de “incompleta”). Esta matriz tem, portan- 

to, uma estrutura idêntica à da matriz de sistema A. O sistema matricial relativo a esta 

factorização é dado por: 

LL T x¡b (3.17)


em que, como A é simétrica, LL T¡A. Se a factorização fosse completa resolver-se-ia 

então o sistema Lu¡bede seguida o sistema L T x¡u, obtendo-se a solução x para o 

sistema inicial, Ax¡b. Como é muito dispendioso em termos computacionais calcular a 

factorização completa de Cholesky (que seria equivalente à resolução directa pelo método 

de Gauss), usa-se a factorização incompleta como pré-condicionador. 

Existe também a factorização incompleta LU, cuja formulação se baseia no método 

de eliminação de Gauss e se utiliza para matrizes não simétricas. Esta factorização é 

aplicável a matrizes assimétricas, pelo que é de prever que não seja tão eficiente como a 

factorização ICH no pré-condicionamento do problema. 

O pré-condicionamento de Jacobi é dado pela matriz 

MJ¡D (3.18) 

em que D é simplesmente a diagonal de A. No caso da matriz de pré-condicionamento 

pelo método SOR tem-se: 

MSOR¡1 

(3.19) 

A factorização que demonstrou melhores resultados foi a ICHCG e será ela a usada 

ω¢DωL¤ 

na implementação do PCG.

Capítulo 4 

Métodos Multi-Nível 

O algoritmo de maior relevância desenvolvido neste trabalho, o Multigrid, insere-se no 

conjunto de algoritmos Multi-nível. Nesta classe de algoritmos, o problema é resolvido 

com recurso a diferentes níveis de discretização. Nos níveis de maior precisão são ape- 

nas efectuados alguns passos de um algoritmo de relaxação, sendo o problema resolvido 

apenas no nível de menor precisão, onde essa resolução, devido à menor complexidade, é 

computacionalmente viável. 

4.1 Multigrid 

O Multigrid [16, 17, 18] é um caso particular dos algoritmos Multi-nível, pois em ca- 

da nível o problema é discretizado segundo uma grelha (grid) referente a uma dada 

discretização. A discretização usada nos outros métodos iterativos é neste a grelha mais 

fina, sendo elaboradas grelhas sucessivamente mais grosseiras a partir desta. A ideia 

básica do Multigrid a dois níveis é projectar o problema da grelha mais fina para a se- 

gunda grelha, mais grosseira, e nesta resolver o problema por um qualquer dos métodos 

apresentados no capítulo anterior. A resolução do problema na grelha grosseira deve ser 

computacionalmente viável, mas a sua solução pode não satisfazer a tolerância na grelha 

mais fina. Há então que repetir o processo de modo a garantir a convergência. 

Um verdadeiro algoritmo Multigrid consiste naquilo que foi exposto no parágrafo 

anterior só que com um número arbitrário de grelhas, sendo a sua implementação concep- 

tualmente recursiva. Os pormenores deste algoritmo, bem como da sua implementação, 

43

44 CAPÍTULO 4. MÉTODOS MULTI-NÍVEL 

são apresentados nas secções seguintes. 

4.1.1 Operadores de Projecção e Interpolação 

Na introdução deste capítulo menciona-se a necessidade de transferir o problema de uma 

grelha (discretização) para outra. Isto é feito através de operadores de projecção (pas- 

sagem de uma grelha fina para uma mais grosseira) e de interpolação (o inverso). 

A passagem do problema de uma grelha mais fina para uma grelha mais grosseira 

consta da reconstrução da rede tridimensional de resistências na grelha inferior, de espa- 

çamento duplo em relação à grelha de cima. 

Sendo h o espaçamento no nível (grelha) 0, temos 2h no nível 1, 4h no nível 2 e 

assim por diante. Desta forma, Ah representa a matriz do sistema no nível 0, A2h a matriz 

no nível imediatamente inferior, etc. A mesma nomenclatura se aplica aos vectores x e 

b. Seguindo esta nomenclatura há que passar do problema Ahxh¡bh para o problema 

A2hx2h¡b2h. 

Existem vários métodos distintos de projecção, três dos quais merecem especial re- 

ferência: projecção directa, projecção pesada e projecção transposta (assim chamada por 

se utilizar a transposta do operador de interpolação). Para o cálculo do operador de 

interpolação discutir-se-á apenas um método. Estes processos serão explicados no decor- 

rer desta secção. 

Como a transferência inter-grelha a três dimensões é um processo algo complexo, 

como exemplo introdutório será usado um caso a uma dimensão apenas. No final da 

secção será descrito o processo a 3D. A 1D tem-se, portanto, a projecção que se representa 

na Figura 4.1. Passa-se de uma rede de resistências com espaçamento h, para outra de 

espaçamento 2h. Neste caso está-se perante a projecção directa. Como se pode ver, para 

cada nó cujo valor é directamente usado da grelha superior existe um nó que é descartado. 

Neste tipo de projecção tem-se 

vj¡vi; j¡1£2£3£;i¡2 

j1 

(4.1) 

No caso da projecção pesada nenhum nó é descartado, sendo o valor de todos eles 

utilizado de forma pesada para obter os nós da grelha inferior como se pode ver na Figura 

4.2. Para este caso, os nós da grelha inferior são obtidos segundo a seguinte expressão:

4.1. MULTIGRID 45 

v1 g1 v2 g2 v3 g3 v4 g4 v5 

x1 x1 

x1 

v1’ g1’ v2’ g2’ v3’ 

x1/2 

Figura 4.1: Projecção directa a uma dimensão. 

v1 g1 v2 g2 v3 g3 v4 g4 v5 

x1/2 x1/4 

x1/2 

x1/4 

x1/2 x1/2 

v1’ g1’ v2’ g2’ v3’ 

Figura 4.2: Projecção pesada a uma dimensão. 

gi1 

vj¡1 

2vi1 gi1gi 2¢ vi1 gi 

gi1gi vi1¤; j¡1£2£3£;i¡2 j1 

(4.2) 

Como se pode observar, cada nó retira metade da informação do nó correspondente 

na grelha superior e a outra metade dos dois nós superiores adjacentes (que não figuram 

na grelha inferior) de forma pesada pelas respectivas condutâncias. 

No entanto, os processos de projecção apresentados destinam-se a projectar nós de 

tensão e o que se quer é projectar a matriz de condutâncias. Verifica-se [16, 17, 18] que 

os operadores que relacionam vh com v2h podem ser aplicados à matriz Ah para obter a 

matriz A2h, isto é: 

Sendo P 2h 

h 

tal que v2h¡P 2h 

h vh e I h 2h tal que vh¡I h 2h v2h 

Então A2h¡P 2h 

h AhI h 2h v2h 

em que P 2h 

h é o operador de projecção do nível h para o nível 2h e Ih 2h 

(4.3) 

o operador de 

interpolação do nível 2h para o nível h. A forma de obter o operador de interpolação será 

apresentada mais à frente. Resta saber como explicitar a matriz P 2h 

h 

para uma dimensão e, 

posteriormente, para as três dimensões. As matrizes de projecção não são quadradas, dado 

que reflectem a passagem de um sistema de dimensão N, para um sistema de dimensão 

N1 

2 , como se pode concluir pelas Figuras 4.1 e 4.2.


Projecção Directa 

Partindo da Expressão (4.1) pode chegar-se à seguinte estrutura para a matriz P2h h , que, 

multiplicada pelo vector de tensões na grelha superior, vh, resulta no vector de tensões da 

grelha inferior, v2h: 

Projecção Pesada 

P 2h 

h ¡ 

 

1 

1 

1 

. .. 

1 

 

(4.4) 

No caso da projecção pesada a matriz de projecção é mais complexa. Cada nó da nova 

grelha não depende apenas daquele que lhe corresponde na grelha de partida, mas também 

dos que lhe são adjacentes. 

P 2h 

h ¡ 

Tem-se então a seguinte matriz: 

1 

2 

1 

2 

g2 1 2g2g3 

2 

g3 2g2g3 

g4 1 2g4g5 

2 

g5 

. 2g4g5 

 

gm1 

Como se pode ver, os nós terminais da grelha inferior são obtidos através de médias 

2gm2gm1 

.. 

gm2 1 2gm2gm1 

2 

1 

2 

1 

2 

(4.5) 

simples, enquanto que os nós internos dependem já dos valores das condutâncias adja- 

centes. 

Operador de Interpolação 

Ao contrário dos operadores de projecção, em que foram estudados operadores de três 

tipos, em relação ao operador de interpolação, vulgo interpolador, apenas um foi desen-


volvido. 

v1’ g1’ v2’ g2’ v3’ 

v1 g1 v2 g2 v3 g3 v4 g4 v5 

Figura 4.3: Interpolação a uma dimensão. 

O processo de interpolação, a uma dimensão, é ilustrado na Figura 4.3. Para este 

tipo de operação, os nós da grelha superior são obtidos a partir dos nós da grelha inferior 

segundo a seguinte expressão: 

vi¡vj£para i¡1£3£5£e j¡i1 

2 

£para i¡2£4£6£e vi¡gi1vjgivj1 

j¡i 

gi1gi 

2 

(4.6) 

Em termos matriciais, o interpolador, assim como os projectores, não é uma matriz 

quadrada. Neste caso, o interpolador faz a transferência de um sistema de dimensão N1 

2 

para um sistema de dimensão N, pelo que é representado por uma matriz de N N1 

2 . 

A estrutura da matriz para este operador é dada na Equação 4.7. 

Operadores a 3-D 

I h 2h¡ 

 

1 

g1 

g1g2 

g2 

g1g2 

1 

g3 

g3g4 

g4 

g3g4 

. .. 

1 

 

(4.7) 

Nesta subsecção ilustra-se a forma de calcular os operadores de transferência inter-grelha 

(projector e interpolador) a três dimensões, que é o caso de interesse neste trabalho. As 

projecções directa e pesada têm uma reduzida aplicação prática no problema em questão, 

pois não são suficientemente robustas, como se verá na secção 4.3.2. Para o caso da 

projecção transposta, o operador de projecção é calculado por transposição da matriz do


v1 

g135 

g513 

g531 

g15 

g13 

g31 

g51 

g35 

g1 

g53 

g3 

g5 

vx 

5 

1 2 

Figura 4.4: Esquema de numeração de condutâncias. À direita indica-se a numeração 

associada a cada sentido. 

interpolador, pelo que é suficiente demonstrar a forma de calcular este último. 

Na Figura 4.4 apresenta-se um esquema de uma porção da rede tridimensional de 

condutâncias, em que cada aresta representa uma condutância de interligação entre dois 

nós do nível h. O nó assinalado a branco representa o caso genérico de um nó que não 

existe no nível 2h (inferior), mas que existe do nível h (superior), pelo que quando se faz 

a interpolação do nível 2h para o nível h se tem que calcular o seu valor com base nos nós 

que existem no nível 2h (assinalados a preto). Os restantes nós não assinalados têm um 

processo de cálculo mais simples, facilmente extrapolável a partir do processo de cálculo 

do nó a branco, que é de seguida explicado. 

Para calcular o valor de tensão do nó vx, com base nos valores dos oito nós a preto, 

há que ponderar o valor das 54 condutâncias que formam as arestas que se ilustram na 

figura. Por exemplo, a influência que o nó v1 exerce sobre o nó central na operação de 

interpolação, assume-se que se manifesta pelos seguintes caminhos: 

g1g13g135 

g1g15g513 

g3g31g135 

3 

6 

4


g3g35g531 

g5g51g513 

g5g53g531 

Existem portanto 6 caminhos de dependência para cada nó a preto, o que perfaz um 

total de 48 caminhos a considerar na interpolação do nó central. 

A expressão que relaciona a tensão vx com a tensão v1 – apenas para o primeiro dos 6 

caminhos apresentados – é a seguinte: 

g1 

g1g2g3g4g5g6 g13 

g13g14g15g16 g135 

g135g136 v1 

(4.8) 

Neste trabalho, houve que programar o cálculo das expressões para os 6 caminhos 

vx¡ 

relativos a cada um dos 8 nós a preto. A expressão total tem, portanto, uma dimensão 48 

vezes superior à da Equação 4.8! Por esta razão, a matriz de interpolação é tão complexa 

que não será aqui apresentada explicitamente. 

Havia uma forma alternativa de calcular o operador de interpolação. Essa forma 

consta da decomposição do processo de interpolação nas suas três dimensões. Para is- 

to, calculam-se uma matriz para a interpolação em x, uma matriz para a interpolação em 

y, uma matriz para a interpolação em z e multiplicam-se as três matrizes para se obter a 

matriz de interpolação a 3D. Acontece que a multiplicação de matrizes é pouco eficiente, 

mesmo não se tratando de matrizes densas, pelo que se tivesse sido esse o método utiliza- 

do neste trabalho, o Multigrid seria muito ineficiente, devido ao elevadíssimo tempo gasto 

no setup. Por esta razão, optou-se pelo cálculo directo dos operadores da forma referida, 

obtendo-se de um só passo a matriz final. 

Foram igualmente desenvolvidos o cálculo directo dos operadores de projecção para 

as projecções directa e pesada, mas como estes dois tipos de projecção não têm grande 

interesse prático tais cálculos não serão aqui apresentados. 

4.1.2 Multigrid V-Cycle 

Perante o exposto, o algoritmo Multigrid é dado pelo pseudo-código apresentado no Al- 

goritmo 5. É necessário que estejam previamente calculadas as matrizes de condutâncias


em todos os níveis, Ah, A2h, A4h, etc., que são obtidas através dos operadores de projecção 

e interpolação, como já foi dito. O MG consta então dos seguintes passos: Começa-se 

por aplicar um número reduzido de passos, ν1, de um algoritmo de relaxação ao sistema, 

obtendo-se um vector xh que é já uma aproximação, ainda que má, da solução do sistema. 

De seguida, calcula-se o vector dos resíduos relativos a essa solução e este vector é pro- 

jectado para o nível imediatamente inferior, onde constitui o lado direito do sistema nesse 

nível. Tem-se então no nível inferior um sistema completo A2hx2h¡b2h, que é resolvido 

recursivamente. Quando se regressa já com a solução x2h, este vector constitui o vector 

da estimativa de erro no nível h, pelo que ele é interpolado do nível 2h para o nível h e 

é usado para corrigir a solução xh. Relaxa-se novamente o sistema com um número de 

iterações, ν2, que pode ser ou não diferente do número de relaxações anteriores. Nesta 

fase pode calcular-se de novo o resíduo e analisar a sua norma, de modo a verificar se esta 

satisfaz a tolerância pretendida. Se sim, o algoritmo termina, se não, volta-se ao início. 

Algoritmo 5 Multigrid, xh¡MG h¢Ah£bh¤. 

1. Se se estiver perante o nível mais grosseiro, resolver o sistema nesse nível ou, em 

alternativa, aplicar ν1ν2 iterações de relaxação ao sistema e retornar o vector x 

resultante. 

2. Em caso contrário fazer: 

(a) Calcular a aproximação inicial para xh. 

(b) Aplicar ν1 iterações de um algoritmo de relaxação ao sistema, 

relax¢Ah£bh£ν1¤. 

xh¡ 

(c) Calcular o resíduo resultante do processo de relaxação, rh¡bhAhxh 

(d) Projectar o resíduo para o nível inferior, b2h¡P 2h 

h rh 

(e) Calcular x2h¡MG 2h¢A2h£b2h¤ 

(f) Interpolar a solução no nível inferior, eh¡I h 2hx2h (g) Ajustar a solução, xh¡xheh 

(h) Aplicar ν1 iterações de um algoritmo de relaxação ao sistema, 


xh¡


Este algoritmo consiste num ciclo V, pois é a forma desta letra que sugerem os pas- 

sos que ele toma, dado que se projecta sucessivamente o problema até ao nível inferior, 

resolve-se o sistema nesse nível e se interpolam sucessivamente as soluções à medida que 

se vão fazendo as correcções. Como isto é feito uma vez por iteração, ou ciclo, estamos 

perante o Multigrid de Ciclo-V. 

Como no MG se fazem apenas duas ou três iterações de relaxação de cada vez, o 

algoritmo de relaxação nele utilizado será o método de Gauss-Seidel, pois, como se pode 

ver pela figura 3.3, foi o método que apresentou a melhor característica de convergência 

para um número reduzido de iterações. 

De seguida apresenta-se a versão mais geral do Multigrid, o Full Multigrid Cycle. 

4.1.3 Full Multigrid Cycle 

Neste algoritmo, em vez de se descer até ao nível inferior e depois subir, o problema é 

remetido directamente para o nível mais baixo, onde é resolvido, e, de forma sucessiva, as 

soluções obtidas nos níveis mais baixos vão sendo interpoladas e servindo de aproximação 

inicial para a resolução do problema nos níveis superiores. 

O pseudo-código apresenta-se no Algoritmo 6. 

Algoritmo 6 Full Multigrid, xh¡FMG h¢Ah£bh¤. 

1. Se se estiver perante o nível mais grosseiro, usar como aproximação inicial o vector 

nulo, resolver o sistema e retornar o resultado. Em caso contrário prosseguir. 

2. Projectar o lado direito do sistema, b2h¡P 2h 

h bh 

3. Calcular x2h¡FMG 2h¢A2h£b2h¤ 

4. Interpolar a solução obtida no nível inferior, xh¡I h 2hx2h 5. Aplicar ν0 iterações de um algoritmo de relaxação ao sistema, 


xh¡ 

Como se pode observar, as principais diferenças em relação ao algoritmo MG são: 

Não é o resíduo, r, que é projectado, mas sim o vector b, dado que o que se quer 

fazer é obter uma representação do problema no nível mais baixo;


h 

2h 

4h 

8h 

Figura 4.5: Multigrid de ciclo completo. 

Não é o erro, e, que é interpolado, mas sim a aproximação inicial para o vector 

solução, x. 

A evolução do ciclo descrito por este algoritmo está ilustrada na Figura 4.5. 

4.2 Multigrid Preconditioned Conjugate Gradient 

Na secção 3.2.3 foi referida a forma como o CG é pré-condicionado, através do uso da 

matriz de pré-condicionamento, M. O passo principal de pré-condicionamento é, no PCG, 

a multiplicação r¡M1 z. Ora, isto não é mais que resolver o sistema Mr¡z. No 

MGPCG, este passo é efectuado por uma (eventualmente duas) iterações de Multigrid, 

i.e., r¡MG¢M£z¤. O facto de se efectuarem apenas uma ou duas iterações de MG no 

passo de pré-condicionamento do MGPCG não inviabiliza a sua convergência, dado que 

este passo é apenas uma aproximação da solução do sistema e não exige um resultado 

exacto. 

O pseudo-código do MGPCG apresenta-se no Algoritmo 7. 

4.3 Análise do Desempenho do Algoritmo Multigrid 

Nesta secção são apresentados um estudo sobre a complexidade do Multigrid e a análise 

detalhada dos parâmetros e factores que afectam o seu desempenho.

4.3. ANÁLISE DO DESEMPENHO DO ALGORITMO MULTIGRID 53 

Algoritmo 7 MGPCG, Multigrid Preconditioned Conjugate Gradient. 

1. Sejam r0¡bAx0, z0¡M1 r0 e p0¡z0. 


3. α¡ 

r 

convergir: 

jz 

Ap jp j j 

4. x j1¡x jα j p j 

5. r j1¡r jα jAp j 

j1¤ 

j1 j 

6. z j1¡MG¢M£r 

7. 

j1z 

β j¡rr jz 

8. p j1¡z j1β j p j 

4.3.1 Análise da Complexidade do Multigrid 

Nesta secção é analisada a complexidade da versão mais simples do Multigrid: o Multi- 

grid Ciclo-V. São feitas estimativas do número de operações que o algoritmo comporta, 

assim como dos seus requisitos de memória. 

Nos cálculos que se seguem, assume-se que o tipo de projecção usada é a projecção 

transposta, pois, como será demonstrado na secção 4.3.2, é a única que providencia ro- 

bustez ao MG na resolução deste problema. 

Complexidade Temporal 

De seguida será contabilizado o número de operações aritméticas de cada um dos passos 

do Multigrid Ciclo-V apresentado no Algoritmo 5. Nestes cálculos, assume-se que as 

matrizes têm em cada linha tantos elementos não nulos quanto o número de diagonais da 

matriz. Isto não se verifica para as linhas correspondentes a nós fronteira, mas como o seu 

número é desprezável face à dimensão da matriz, pode ignorar-se esse pormenor sem uma 

perda significativa de rigor. Será usada a notação D para o número de diagonais da matriz 

de sistema e N para a sua dimensão, correspondendo a uma discretização de m n d.


Relaxação de Gauss-Seidel Na relaxação de Gauss-Seidel (Equação 3.8), faz-se a mul- 

tiplicação da parte triangular superior de A por x, ou seja, Ux. Como U tem apenas 3 

diagonais, no produto Ux tem-se para cada linha 3 multiplicações e 2 adições. No total, 

e no caso genérico de uma matriz de D diagonais, têm-se aproximadamente¢D1¤N 

multiplicações e¢D2¤N adições. 

No cálculo do resíduo da relaxação, bUx, têm-se simplesmente N adições. 

Quanto ao passo de substituição descendente, está-se a sistema¢LD¤x¡ 

resolver o 

b. Na primeira linha tem-se x1¡b1 . Na segunda, x2¡b2a21x1 e por aí em diante. Nu- 

a11 a11 

ma linha genérica, com 4 elementos (LD tem 4 diagonais), têm-se 3 multiplicações, 

3 adições e 1 divisão. No total, e considerando uma matriz de D diagonais, são aproxi- 

madamente¢D1¤N multiplicações,¢D1¤N adições e N divisões. 

Como normalmente se fazem duas iterações de Gauss-Seidel por iteração de MG, há 

que multiplicar o número de operações deste passo por dois. Na equação (4.9) tem-se o 

total de operações para este passo do Multigrid, em que©representa as multiplicações, 

¨as adições eas divisões. 

#op¢GS¤¡2 ¢D1¤N©¢D1¤N¨N (4.9) 

Cálculo do Resíduo O cálculo do resíduo do Multigrid (Algoritmo 5) comporta DN 

multiplicações (Ax) e N adições (bAx). Na equação (4.11) tem-se o número de operações 

para este passo. 

#op¢res¤¡DN©N¨ (4.10) 

Suavização do Resíduo No algoritmo de suavização do resíduo (4.3.2) fazem-se dois 

produtos internos (2N multiplicações), duas multiplicações escalar-vector (2N multipli- 

cações) e quatro adições de vectores (4N adições). O número de operações para o MRS 

é, portanto: 

#op¢MRS¤¡4N©4N¨ (4.11)


Projecção Não é simples estimar o número exacto de operações correspondente à pro- 

jecção do resíduo, pois o número de elementos não nulos do projector depende do proble- 

ma. No caso da projecção transposta, o operador de projecção é o transposto do operador 

de interpolação. Por sua vez, o operador de interpolação tem de reflectir a dependência 

de cada nó da grelha h de 26 nós da grelha 2h, pelo que cada linha do interpolador terá 

no máximo 26 elementos não nulos. Usando este valor como sobrestimativa e sabendo 

que P 2h 

h ¡¢I 

h 2h¤T tem-se 26N multiplicações e 25N adições no produto b2h¡P 2h 

h rh. Na 

equação (4.12) apresenta-se o número de operações para o passo de projecção. 

#op¢pro j¤¡26N©25N¨ (4.12) 

Interpolação Pelo que foi exposta na subsecção anterior o cálculo do número de operações 

do passo de interpolação, eh¡I h 2h x2h, do Multigrid é: 

(4.13) 

#op¢inter¤¡26N©25N¨ 

Ajuste da Solução O ajuste da solução, xh¡xheh, consta de N adições: 

#op¢a juste¤¡N¨ (4.14) 

Norma do Resíduo O cálculo da norma do resíduo é dado por: 

r¡r1 2r2 2rN 2£r¡r1£r2££rNT 

(4.15) 

pelo que comporta o equivalente a 2N multiplicações e 2N1 adições (desprezando o 

cálculo da raiz quadrada). Logo: 

#op¢norma res¤¡2N©¢2N1¤¨ 

(4.16) 

Total de operações do Multigrid Ciclo-V Pela estrutura do Multigrid, há que contabi- 

lizar as operações relativas a todos os níveis. No nível h têm-se um sistema de m n d. 

No nível 2h passa-se para um sistema de m1 n1 d1 

2 2 2 

dade nos dois níveis é dada por: 

. A relação entre a complexi


m n d 

m1 

2 n1 

2 d1 

2 8 (4.17) 

Isto é, quando se passa do nível superior para o segundo nível a complexidade com- 

putacional reduz-se em cerca de 8 vezes. Por sua vez, em relação ao primeiro nível o ter- 

ceiro nível tem uma complexidade cerca de 64 vezes inferior. Isto corresponde à seguinte 

série: 

l1 

∑ 

i0 

1 

8i¦ 1 

(4.18) 

11 

8 

em que l é o número de níveis. 

Aproveitando os resultados das anteriores tem-se para o primeiro nível do MG: 

se: 

(4.19) 

Considerando que no primeiro nível a matriz principal tem 7 diagonais (D¡7) tem- 

#op¢MG1¤¢3D56¤N©¢2D56¤N¨2N 

(4.20) 

#op¢MG1¤77N©70N¨2N 

No segundo nível, e posteriores, verificou-se experimentalmente que para o caso da 

projecção transposta as matrizes de sistema, A2h, A4h, etc., têm 27 1 diagonais, pelo que: 

#op¢MG2¤137 N 

8©110 N 8¨2 N 

(4.21) 

No total, e aproveitando o resultado da Equação (4.18), têm-se para o número de 

8 

operações do Multigrid Ciclo-V: 

(4.22) 

#op¢MG¤97N©86N¨2N 

Estes cálculos não são exactos, pois, além das aproximações já referidas, despreza- 

ram-se os tempos de acesso aos elementos das matrizes esparsas e fizeram-se aproximações 

assimptóticas. 

1 Este número está obviamente relacionado com a dependência dos 26 nós circundantes quando se pro- 

jecta o problema com a projecção transposta.


Complexidade do Tempo de Setup O tempo de setup do MG é dominado pelo tempo 

de obtenção das matrizes de sistema nos níveis inferiores através da fórmula: 

A2h¡P 2h 

h AhI h 2h 

(4.23) 

Para o primeiro nível, as dimensões das matrizes usadas na equação anterior são as 

seguintes: N 

8 N 

N 

8¡ N NN 8 N N 

Em termos computacionais é mais vantajoso fazer primeiro o produto AI e multiplicar 

8 

(4.24) 

o resultado por P do que calcular PA e somente depois multiplicar por I. Isto acontece 

porque o produto PA tem mais elementos não nulos que o produto AI, pelo que seriam 

temporariamente alocados mais elementos no primeiro caso. 

Para o produto AI tem-se N 7 N 8¡7 8 N 2 multiplicações. Tanto a matriz que resulta 

do produto AI como P têm 27 diagonais, pelo que P AI consta de N 8 27 N 8¡27 

64 N 2 

multiplicações. 

No total, o produto PAI no primeiro nível engloba cerca de 83 

64 N2 multiplicações pelo 

que o tempo de setup do MG tem complexidade O¢N 2¤. Usando novamente o resultado 

de 4.18 tem-se para o setup de todos os níveis um número de operações: 

Complexidade de Memória 

#op¢setup¤¡83 

56 N2 

(4.25) 

Tal como na análise da complexidade temporal do Multigrid aqui assume-se que uma 

matriz com D diagonais tem D elementos em qualquer das suas linhas. As estruturas 

mais relevantes em termos de ocupação de memória são as matrizes A, P, I e os vectores 

b, x, r e e. 

Para o primeiro nível, os requisitos de memória estão ilustrados na Tabela 4.1. No 

segundo nível, e como já foi explicado anteriormente, a matriz A tem 27 diagonais. A 

memória ocupada neste nível pelas estruturas mais relevantes está na Tabela 4.2. 

No total, e usando novamente o resultado de (4.18), o Multigrid de Ciclo-V ocupa 

aproximadamente:


Estrutura Número de elementos 

A 7N 

P 26N 

I 26N 

vectores 4N 

Total 63N 

Tabela 4.1: Requisitos de memória para o primeiro nível do Multigrid. 

Estrutura Número de elementos 

A 27 N 8 

P 26 N 8 

I 26 N 8 

vectores 4 N 8 

Total 10N 

Tabela 4.2: Requisitos de memória para o segundo nível do Multigrid. 

mem¢MG¤75N elementos (4.26) 

Um problema de 129 129 129 numa máquina de 64-bit ocupará, portanto: 

75 129 129 129 812GB (4.27) 

Experimentalmente verifica-se que este número se aproxima de 1.5 GB devido à 

ocupação das estruturas de acesso às matrizes esparsas e outras estruturas auxiliares. 

Nas Tabelas 4.3 e 4.4 comparam-se o número de operações e os requisitos de memória 

para os diversos métodos apresentados. 

Como foi visto, o método GE apresenta uma complexidade um pouco acima de qua- 

drática, sendo de prever que seja o pior método para resolver este problema. Seguem-se 

os métodos de relaxação, que embora ocupem dez vezes mais memória, possuem uma 

complexidade aproximadamente linear. Quanto ao GMRES, este apresenta uma complex- 

idade dependente do número de iterações do algoritmo, pelo que será somente vantajoso 

quando se verificar que o problema é resolúvel num reduzido número de iterações. O CG


Método Divisões Multiplicações Adições 

GE N 5 3 N 7 3 N 7 3 

Jacobi - 7N 6N 

GS N 6N 6N 

SOR N 7N 7N 

GMRES mN m¢m7¤Nm 3 

2 

3 

m¢m6¤Nm 

2 

CG - 13N 12N 

PCG 2N 19N 18N 

MG 2N 97N 86N 

Tabela 4.3: Número de operações para os diversos métodos apresentados, considerando 

m¡n¡d¡3N. 

apresenta, por sua vez, uma complexidade na ordem de linear, embora o peso por iteração 

e os requisitos de memória sejam superiores aos dos métodos de relaxação. Os métodos 

de Krylov pré-condicionados requerem a reserva adicional de memória para guardar a 

matriz de pré-condicionamento, mas espera-se que apresentem um número de iterações 

compensatório. Em relação ao MG é de notar que os valores apresentados tanto para o 

número de operações como para os requisitos de memória são sobre-estimativas, dado 

que não é trivial calcular com exactidão o número de elementos não nulos dos operadores 

de projecção e interpolação, tendo-se usado um majorante. Quanto maior for o número de 

elementos não nulos destes operadores, maiores são a quantidade de memória necessária 

pelo MG e o seu tempo de iteração. No entanto, não deixa de ser claro que o MG é de 

todos o algoritmo com maiores requisitos de memória e tempo de iteração, mas devido 

à sua característica de convergência, espera-se que o seu tempo total de execução seja 

inferior ao dos outros algoritmos. 

4.3.2 Parâmetros e Factores que Afectam o Desempenho do Multi- 

grid 

De seguida são enumerados os diferentes parâmetros e factores que influenciam o desem- 

penho do algoritmo Multigrid. 

Para se ilustrar o impacto que cada um dos parâmetros tem na execução do algoritmo,


Método Número de Elementos 

GE N 5 3 

Jacobi 10N 

GS 10N 

SOR 11N 

GMRES 

¢13m¤ Nm 2 

2 

CG 12N 

PGMRES 

¢20m¤ Nm 2 

2 

PCG 19N 

MG 75N 

Tabela 4.4: Requisitos de memória para os diversos métodos apresentados, considerando 

m¡n¡d¡3N. 

apresentar-se-ão, quando conveniente, resultados sobre a extracção do modelo do circuito 

cujo layout e perfil do substrato se apresentam nas Figuras 4.6 e 4.7. 


O número de cortes que se fazem no substrato em cada direcção está directamente rela- 

cionado com a complexidade do problema a resolver, bem como com a precisão da 

solução obtida. 

Uma das principais limitações deste algoritmo baseado no método das diferenças fini- 

tas é, mesmo representando as matrizes, esparsas, de forma compacta, a memória ocupada 

pelo mesmo. Isto verifica-se porque o FDM exige a discretização de todo o domínio. Este 

problema é ainda acentuado pela necessidade do MG em manter em memória as estru- 

turas para as matrizes P, A e I para os vários níveis. Logo, uma discretização elevada pode 

inviabilizar a execução da ferramenta conforme os recursos computacionais disponíveis. 

Como já foi dito, um problema de 129 129 129 ocupa cerca de 1.5 GB de memória. 

No entanto, o número de cortes em z nunca é tão elevado como o número de cortes em 

x e y, dado que os contactos têm todos a mesma profundidade, bem como os poços e 

guard-rings, e o substrato tem poucas camadas em relação ao número de dispositivos do 

circuito. Admitindo, então, que apenas 9 cortes são necessários em z, podem, com os


100 

100 100 

contacto 

2x2 

10 

100 100 

poço 

4x4 

100 

Figura 4.6: Vista de topo da configuração de teste 1. 

backplane 

Condutividade = 1 Ohm cm 

Condutividade = 15 Ohm cm 

1 4 

Figura 4.7: Vista lateral da configuração de teste 1. 

0 

-1 

-4 

-10 

-100


Discretização Resistência do contacto 

x y z para o backplane (Ω) 

9x9x9 3.247234e+02 

17x17x17 5.991128e+02 

33x33x33 7.255608e+02 

65x65x65 9.302068e+02 

129x129x129 1.062022e+03 

Tabela 4.5: Influência do nível de discretização não-uniforme na precisão do resultado 

obtido. Valores obtidos para a resistência entre o contacto e o backplane na configuração 

da Figura 4.6. 

Discretização Resistência do contacto 

x y z para o backplane (Ω) 

9x9x9 3.247234e+02 

17x17x17 4.967046e+02 

33x33x33 9.239664e+02 

65x65x65 1.164496e+03 

129x129x129 1.168738e+03 

Tabela 4.6: Influência do nível de discretização não-uniforme adaptável na precisão do 

resultado obtido. Valores obtidos para a resistência entre o contacto e o backplane na 

configuração da Figura 4.6. 

mesmos 1.5 GB de memória, resolver-se problemas de complexidade 513 513 9. 

Aplicando os dois tipos de discretização, não-uniforme e não-uniforme adaptável, e 

variando o nível de discretização, obtêm-se os resultados que se apresentam nas Tabelas 

4.5 e 4.6. Como se pode ver, para uma discretização de 17 17 17 a discretização 

não-uniforme apresenta um valor mais preciso que a discretização adaptável. Isto acon- 

tece, porque como ainda há poucos cortes para distribuir é praticamente irrelevante que 

algoritmo de discretização se está a usar. No entanto, conforme se vai discretizando mais 

profusamente o substrato – e repare-se que este aumento não é linear – o método de 

discretização adaptável começa a produzir resultados melhores.


Valor da resistência extraída (Ohm) 

1200 

1100 

1000 

900 

800 

700 

600 

500 

400 

10 2 

300 

Discretização não−uniforme 

Discretização adaptável 

10 3 

10 4 

10 5 

Número de nós da grelha utilizada 

Figura 4.8: Evolução da resistência extraída com o nível de discretização. 

Não foi possível correr esta extracção com o nível seguinte de discretização (257 

257 257) por limitações de memória. No entanto, aplicando um algoritmo de extrapo- 

lação por aproximação a uma função racional [39] pode estimar-se o valor da resistência 

extraída para cada tipo de discretização, caso tivessem sido aplicados 257 257 257 

cortes. Esses valores são: 

Discretização não-uniforme: 1.088406e+03 Ω 

Discretização adaptável: 1.174503e+03 Ω 

O método das diferenças finitas tende para precisão infinita (erro tende para zero) à 

medida que o espaçamento entre cortes tende para zero. O valor da resistência para o qual 

ambos os métodos de discretização convergem é, teoricamente, o valor exacto, embora se 

verifique que essa evolução é mais rápida quando se usa a discretização adaptável, por se 

ter em conta a localização específica dos contactos. 

No entanto, a discretização adaptável não traz só vantagens. Devido às diferenças de 

espaçamento entre os cortes em cada direcção, e como a condutividade do meio é con- 

siderada constante dentro de cada camada, este tipo de discretização origina entradas de 

valores muito diferentes na matriz de sistema. Tem-se, portanto, que o condicionamento 

da matriz de sistema, A, em cada um dos métodos de discretização, é significativamente 

diferente, como se pode ver pela Tabela 4.7. 

10 6 

10 7


Discretização Discretização 

Não-uniforme Adaptável 

Ah 2.2058e+04 3.6349e+05 

A2h 2.1370e+03 5.9661e+04 

A4h 452.7323 4.1168e+03 

A8h 170.3852 709.5211 

A16h 193.8273 10.6972 

Tabela 4.7: Condicionamento da matriz de sistema consoante o método de discretização 

utilizado. Quanto maior for o número de condição da matriz, maior é a dificuldade em 

resolver o respectivo sistema. 

Isto leva a que a utilização da discretização adaptável atrase ou impossibilite a con- 

vergência do MG, pelo que nem sempre deve ser utilizada. 

Número de Níveis 

Na determinação do número de níveis a utilizar num algoritmo Multigrid há que ter em 

conta que o sistema irá ser resolvido à precisão máxima no nível inferior. Se o número 

de níveis for diminuto, existe o risco de o problema de nível inferior ser ainda demasiado 

complexo e perder-se muito tempo nesse nível. 

Na Tabela 4.8, apresenta-se a evolução do tempo de execução do algoritmo face ao 

número de níveis escolhido. O teste em questão foi efectuado sobre o exemplo da Figura 

4.6 com uma discretização de 129 129 129, o que permite um máximo de 7 níveis. 

Conclui-se, pelos resultados apresentados na tabela, que é necessário descer 2 níveis, 

pelo menos, para que se obtenha um desempenho razoável. Não há desvantagem em 

empregar o número máximo de níveis, pois, como se pode ver, até é com ele que se 

obtém o menor tempo de execução. 

Tipo de Projecção 

Verifica-se que, para este tipo de aplicação do MG, apenas a projecção transposta é robus- 

ta. As outras duas podem levar a resultados erróneos. A causa deste problema é explicada 

através do exemplo que se segue.


Número de níveis Tempo de execução (s) 

1 2101.88 

2 743.06 

3 650.65 

4 638.05 

5 638.92 

6 638.98 

7 635.44 

Tabela 4.8: Evolução do tempo de execução do Multigrid em função do número de níveis. 

21 22 23 24 25 

16 17 18 19 20 

11 12 13 14 15 

6 7 8 9 10 

1 2 3 4 5 

Figura 4.9: Problema das projecções directa e pesada.


A Figura 4.9 representa uma vista de topo da discretização de um substrato com ape- 

nas um contacto. A zona a tracejado representa o contacto, ou seja, uma zona de fontes 

de corrente correspondentes ao equivalente de Norton da tensão imposta no contacto. Se 

esta não existisse, o sistema não teria solução única, que, como se verá adiante, é o que 

acontece em níveis inferiores caso se usem as projecções directa ou pesada. 

No segundo nível de MG, só os nós assinalados com uma circunferência permanecem, 

no entanto, ainda existe um nó a impor corrente, o 13. Quando se passa para o terceiro 

nível, o nó 13 desaparece, ficando apenas os nós duplamente assinalados. Ora, neste nível, 

está-se perante um sistema de: solução arbitrária, na ausência de backplane, ou solução 

nula (x¡0), na presença de backplane 2 , dado que este impõe o potencial de 0V em todos 

os nós da grelha. 

É legítimo pensar que este problema só se verifica com a projecção directa, pois é a 

única que não tem em consideração os valores dos nós adjacentes aquando da projecção, 

mas o problema existe também para a projecção pesada. Esta última, também chamada 

de half-weighting, padece da mesma deficiência porque tem apenas em consideração um 

sub-conjunto dos nós adjacentes ao nó projectado. A projecção pesada funciona para um 

universo de problemas que engloba os problemas resolúveis com a projecção directa. 

Verifica-se que só a projecção transposta, por ter em conta todos os 26 nós adjacentes 

ao nó projectado, funciona para todo o tipo de problemas testados. 

Na Tabela 4.9 apresentam-se os valores do desempenho de cada uma das projecções 

na resolução do problema da Figura 4.6. Como se pode observar a projecção transposta 

é a que apresenta a melhor convergência (menor número de iterações). No entanto, este 

tipo de projecção é também a que comporta um maior custo por iteração, pelo que não 

é óbvio que a projecção transposta apresente o menor tempo de execução. À parte do 

facto de a projecção transposta ser a única que garante a preservação das características 

do sistema nos vários níveis, ela só é vantajosa em termos de desempenho, quando o 

respectivo número de iterações for baixo o suficiente para compensar o excesso de tempo 

gasto no setup e por iteração. No entanto, como a correcção da solução obtida é prioritária 

em relação ao desempenho do algoritmo, as projecções directa e pesada não têm aqui 

2 É de notar que, embora alguns dos nós do backplane desapareçam devido às operações de projecção, 

haverá sempre pelo menos quatro nós ligados à massa, por se tratarem de nós fronteira (cantos inferiores 

do substrato).


Tipo de Número de Tempo de Tempo de Tempo por Tempo 

projecção iterações setup resolução iteração total 

Directa 45 44.11 630.81 14.02 674.92 

Pesada 30 212.99 458.77 15.29 671.75 

Transposta 21 268.56 339.47 16.17 608.04 

Tabela 4.9: Desempenho do Multigrid face ao tipo de projecção utilizado. 

utilidade prática. 

Número de Iterações Tempo de execução 

Com Backplane 21 608.04 

Sem Backplane 30 778.33 

Tabela 4.10: Influência do backplane no desempenho do Multigrid. 

Presença de Backplane 

A presença de um plano de metal ligado à massa no fundo do substrato, o backplane, 

possibilita uma maior rapidez de convergência na extracção do modelo, porque o número 

de incógnitas é menor, dado que o valor de todos os nós do backplane é conhecido (0V) 

ou, dito de outra forma, há mais fontes de corrente, neste caso, de escoamento de corrente. 

Para exemplificar a alteração na performance do algoritmo quando se retira o back- 

plane veja-se a Tabela 4.10. 

Número de Iterações do Algoritmo de Relaxação Usado 

Este é um dos parâmetros mais importantes na obtenção de um MG eficiente. Se se es- 

colher um número de iterações de relaxação ν muito elevado, o MG converge em poucas 

iterações, mas cada iteração é muito demorada. Se, pelo contrário, se optar por um re- 

duzido número de iterações de relaxação, cada iteração é rápida, mas o MG pode nem 

chegar a convergir por dificuldade em eliminar as componentes de alta frequência do erro 

da solução. 

Normalmente escolhe-se ν¡2antes do passo recursivo do MG e ν¡2depois, ou 

seja, segundo a nomenclatura anteriormente usada, ν1¡2 e ν2¡2, que se verificou ser


Número de Iterações Número de iterações Tempo por Tempo de execução 

de relaxação do Multigrid iteração do Multigrid 

2 21 16.17 608.04 

4 12 29.06 630.83 

variável 20 25.84 801.50 

Tabela 4.11: Influência do número de iterações de relaxação no desempenho do Multigrid. 

uma boa escolha. 

É de notar que no caso do MG com apenas dois níveis é irrelevante fazer ν1 iterações 

antes e ν2 iterações depois. O único aspecto relevante é a soma ν0¡ν1ν2, dado que, a 

partir da primeira iteração os passos de relaxação ν2 e ν1 são, por esta ordem, executados 

sequencialmente. 

Existem casos em que um número de iterações ν1¡ν2¡2 pode inviabilizar a con- 

vergência, devido a dificuldades em eliminar a componentes de alta frequência do erro, o 

que sugere a utilização de uma estratégia acomodativa. Esta técnica consiste em calcular o 

resíduo após cada iteração de relaxação e caso a sua evolução não supere um determinado 

factor pré-determinado termina-se o processo de relaxação (Equação 4.28). Verificou-se, 

no entanto, que esta técnica embora faça diminuir o número de iterações do MG, aumenta 

bastante o custo temporal por iteração, sendo que o seu uso não é vantajoso em termos de 

tempo de execução. 

Se¥rk¥§η¥rk1¥terminar a relaxação 

em caso contrário prosseguir 

(4.28) 

Na Equação (4.28) é usual escolher η¡06, o que significa que ou se melhora em 60 

% a qualidade da solução ou se sai. No entanto, é possível que, ajustando o parâmetro η 

a cada caso, esta técnica produza resultados vantajosos. 

Na Tabela 4.11 ilustra-se o impacto que o número de iterações do algoritmo de relaxação 

tem no Multigrid. Foram corridos testes com ν1¡ν2¡2, ν1¡ν2¡4 e com a estratégia 

acomodativa supra-referida, com η¡066. 

Quando se passam de 2 para 4 iterações de relaxação é natural que se obtenha um 

decréscimo no número de iterações do MG, no entanto, esse ganho pode não ser sufi- 

ciente para compensar a carga de trabalho adicional que mais 4 iterações de relaxação por


Tolerância Número de iterações Tempo de execução Resistência extraída 

109 30 905.29 1.062342e+03 

106 20 704.13 1.062342e+03 

103 10 505.94 1.062342e+03 

102 7 446.03 1.062342e+03 

101 4 383.57 1.062383e+03 

1 2 343.20 1.062028e+03 

Tabela 4.12: Influência da tolerância exigida ao Multigrid no seu desempenho. 

iteração de MG acrescentam. É exactamente isso que se verifica neste exemplo. 

No que respeita à estratégia acomodativa, verifica-se que dado que se tem que calcular 

o resíduo em cada iteração para fazer o teste (4.28) o tempo por iteração de MG sobe 

muito e isso faz com que a estratégia acomodativa não seja vantajosa neste caso. 

Tolerância 

A tolerância a exigir do método deve ser tal que não impossibilite a sua convergência, 

devido a erro numérico, e, simultaneamente, providencie uma boa solução. Como o ε de 

uma máquina 3 de 64 bits é normalmente de 1015 , é razoável utilizar uma tolerância de 

1012 . É óbvio que, dependendo do problema em análise, pode ser vantajoso aumentar a 

tolerância, caso se verifique que tal não prejudica a qualidade da solução, pois o tempo de 

execução do algoritmo é linearmente proporcional ao número de dígitos de precisão da 

solução. No caso da ferramenta de extracção desenvolvida, verificou-se que uma tolerân- 

cia de 104 é suficiente para que se obtenham resultados precisos. 

O critério de paragem utilizado na ferramenta desenvolvida é que a norma do resíduo 

seja inferior à tolerância. 

Na Tabela 4.12 é apresentada a evolução do tempo de execução do algoritmo sobre o 

exemplo da Figura 4.6, bem como a solução obtida, à medida que se diminui a tolerância 

imposta. 

3 O parâmetro ε de uma máquina computacional é um valor ε tal que xεx nessa máquina. Este valor 

é função da representação interna dos números na máquina e de outros parâmetros da sua arquitectura.


Método do nível inferior Tempo de setup Tempo de resolução Tempo total 

GE 251.61 263.32 514.93 

CG 252.30 263.21 515.50 

GMRES 254.46 264.73 519.19 

PCG 255.74 267.16 522.90 

PGMRES 253.78 266.36 520.14 

Tabela 4.13: Desempenho do Multigrid face ao algoritmo utilizado no nível inferior. 

Método Usado no Nível Inferior 

No nível inferior do MG pode ser usado um método directo, tal como o método de 

eliminação de Gauss, ou um método iterativo. A diferença de desempenho consoante 

o método utilizado no nível inferior não é significativa se se impuser uma tolerância na 

ordem de 1012 , pois o GE resolve o sistema de nível inferior à precisão da máquina e 

os métodos iterativos à precisão imposta de 1012 e, deste modo, a precisão da solução 

obtida é muito semelhante. Isto quer dizer que não existe diferença entre o número de 

iterações de MG consoante se muda de método de nível inferior, o que pode haver é uma 

diferença em termos de tempo. Na Tabela 4.13 estão patentes as diferenças em termos do 

tempo de setup e resolução do MG conforme se usam GE, CG, GMRES, PCG e PGMRES 

no nível inferior. 

As diferenças em termos de tempo de setup não são evidentes, mas em princípio seria 

de esperar que o setup dos dois métodos pré-condicionados fosse ligeiramente superior, 

bem como o tempo de cálculo das factorizações relativas ao GE. Isto porque para os 

métodos pré-condicionados tem que se calcular a matriz de pré-condicionamento para o 

nível inferior (factorização incompleta de Cholesky) e no caso de eliminação de Gauss 

tem que se calcular uma factorização LU. No entanto, como a matriz de nível inferior 

tem dimensões muito reduzidas (2 2 2, neste caso) o cálculo das factorizações ICH ou 

LU praticamente não acrescenta nada ao tempo de setup. No entanto, caso fosse usado 

um número de níveis inferior ao número máximo de níveis, o sistema de nível inferior já 

não seria de apenas 2 2 2, mas sim de 3 3 3, 5 5 5, etc., e o tempo de cálculo 

de respectivo pré-condicionador tenderia a não ser desprezável. Isto, assumindo que o 

número de cortes em cada direcção é igual. Caso fosse diferente, podia ter-se no nível


sem MRS 

ν1¡ν2¡4 

com MRS 

ν1¡ν2¡2 

Número de iterações Tempo de Execução 

50 1421.67 

17 514.70 

Tabela 4.14: Impacto da utilização de um método de suavização do resíduo no desempen- 

ho do Multigrid. 

inferior um sistema de, por exemplo, 65 65 2, que implicaria igualmente um maior 

peso na escolha do método a utilizar no nível inferior. 

Em relação ao tempo de resolução é de esperar que os métodos pré-condicionados 

não apresentem um desempenho tão bom, dado que o sistema é, como já foi referido, 

demasiado simples. Ele é tão simples que o método de eliminação de Gauss oferece 

mesmo o melhor desempenho, como se pode ver na coluna do tempo total de execução. 

Novamente, se não se usassem todos os níveis possíveis, o GE deixaria de ser tão eficiente 

no nível inferior e, nesse caso, os métodos pré-condicionados seriam mais vantajosos. 

Como, no entanto, não há desvantagem em utilizar o número máximo de níveis pos- 

sível, pode concluir-se que o método mais eficiente no nível inferior é a eliminação gaus- 

siana. 

Suavização do Resíduo 

De modo a acelerar a convergência do MG inclui-se no seu código um passo de suavização 

do resíduo em cada iteração. Este passo consiste numa extrapolação do método Minimal 

Residual, MRES [37, 38], e tem o nome de Minimal Residual Smoothing. O seu objectivo 

é esbater as componentes de alta frequência do resíduo, ou seja, do erro da solução. 

Verifica-se que a introdução deste passo no fluxo do MG acelera a sua convergência, 

sendo o custo adicional por iteração compensado pelo menor número de iterações obtido. 

O pseudo-código desta técnica é apresentado no Algoritmo 8. 

A comparação entre o desempenho do algoritmo com e sem MRS está patente na 

Tabela 4.14. 

No caso em que não se usou MRS teve que se alterar o número de iterações de


Algoritmo 8 MRS, Minimum Residual Smoothing. 

¢rk£xk¤¡MRS h¢rk1£rk£xk1£xk£b¤ 

1. Se o nível for o primeiro (superior): 

(a) α¡rk1rk 

(b) 

(c) 

rkrk 

x¡xk1α¢xxk1¤ 

r¡rr1α¢rrk1¤ 

2. Em caso contrário: 

(a) 

(b) x¡αx rkrk 

α¡brkb 

(c) 

relaxação de 2 para 4, de modo a viabilizar a convergência do algoritmo, i.e., possibi- 

rk¡bα¢rk1b¤ 

litar a eliminação das componentes de alta frequência do erro. Isto acontece, porque ao 

ser retirado o passo de suavização do resíduo, há que compensar essa falta com algumas 

iterações de relaxação adicionais. No entanto, verifica-se que a presença do passo de 

suavização do resíduo é muito vantajosa, como se pode ver pelos resultados da Tabela 

4.14. 

Aproximação Inicial 

A utilização de uma aproximação inicial não tem impacto significativo no tempo de 

execução do algoritmo. Na presente implementação a aproximação inicial é obtida à 

custa de uma única iteração de MG com apenas uma iteração de relaxação antes e de- 

pois do passo recursivo (ν1¡ν2¡1). Verificou-se experimentalmente que este passo, 

pouco dispendioso em termos computacionais, obtém uma aproximação bastante boa à 

solução do problema, mas não permite poupar significativamente no tempo de execução 

do algoritmo, como se pode ver pela Tabela 4.15. 

A diferença no número de iterações não é efectiva, pois no caso em que é utilizada a 

aproximação inicial, isso pode ser considerado como mais uma iteração de MG.


sem aproximação 

inicial 

com aproximação 

inicial 

Número de iterações Tempo de Execução 

18 521.60 

17 514.70 

Tabela 4.15: Importância da existência de uma aproximação inicial no desempenho do 

Multigrid. 

ρepiρbulk Número de Tempo de Resistência Condição da matriz 

iterações execução extraída de nível inferior 

15 17 514.70 1.062342e+03 587.9035 

200 20 583.23 1.210147e+02 1.5015e+03 

Tabela 4.16: Impacto da resistividade do substrato no condicionamento do sistema a re- 

solver. 

Tecnologia 

As características tecnológicas relativas ao processo de fabrico do circuito em análise 

podem ser mais importantes do que pode parecer à primeira vista. Se, por exemplo, 

o substrato tiver mais do que uma camada e cada camada tiver condutividades muito 

diferentes, isso pode conduzir a uma matriz de sistema mal condicionada, o que pode 

levar a que o algoritmo tenha mais dificuldades em convergir. Isto acontece porque os 

elementos que a constituem são, neste caso, muito diferentes. 

Além disto, o número de camadas do substrato e o facto de os contactos de polarização, 

difusões e poços poderem ter profundidades diferentes, obriga a que se façam mais cortes 

em z, o que limita o número de cortes disponíveis em x e y, face à memória de que se 

dispõe. 

Na Tabela 4.16 é comparado o desempenho do algoritmo na extracção do exemplo da 

Figura 4.6, mas alterando os valores das condutividades das duas camadas. No primeiro 

caso, usaram-se as condutividades descritas nessa figura, ρepi¡1Ωcm e ρbulk¡15Ωcm, 

e no segundo caso usaram-se ρepi¡01Ωcm e ρbulk¡20Ωcm. 

Quanto maior for o número de condição da matriz pior ela é condicionada e, conse-


quentemente, mais difícil é a resolução do sistema. Pode ver-se que o facto de no segundo 

caso as condutividades das duas camadas do substrato serem mais díspares influencia neg- 

ativamente o desempenho do algoritmo.

Capítulo 5 

Validação do Modelo Extraído 

5.1 Metodologia de Teste 

O SMX foi validado da seguinte forma: numa primeira fase, que consiste nas duas 

primeiras experiências apresentadas neste capítulo, foram escolhidas configurações de 

teste muito simples em que é possível calcular as resistências de acoplamento manual- 

mente, possibilitando a verificação do correcto funcionamento do SMX. Nas experiências 

seguintes, o modelo obtido pelo SMX foi comparado com o modelo obtido por outras 

quatro ferramentas de extracção. Na secção 5.3 faz-se um estudo sobre as características 

de acoplamento usando o SMX e por último foi extraído e comparado um modelo de 

um circuito mais complexo, de modo a ilustrar a capacidade da ferramenta em lidar com 

circuitos de maior dimensão. 

5.2 Configurações de Teste 

Os resultados obtidos para as várias configurações de teste são apresentados nas secções 

seguintes. Os extractores utilizados para comparação de resultados com o SMX são: 

Xtract [4], desenvolvido no âmbito do programa de Mestrado de João Paulo Costa 

no grupo ALGOS do INESC ID, Instituto Superior Técnico, Universidade Técnica 

de Lisboa; 

Subx [46], uma das ferramentas de extracção da Design Framework II da Cadence 

Design Systems 

75

76 CAPÍTULO 5. VALIDAÇÃO DO MODELO EXTRAÍDO 

Space [45], desenvolvido no grupo de Circuitos e Sistemas da Faculdade de Enge- 

nharia Electrotécnica da Universidade de Tecnologia de Delft, Holanda 

QuickSub [9], desenvolvido no âmbito do programa de Doutoramento de Mike 

Chou no grupo VLSI-CAD do Laboratório de Investigação de Electrónica do Mas- 

sachusetts Institute of Technology, E.U.A. 

As duas primeiras experiências, em que é possível calcular as resistências de acopla- 

mento manualmente, não são, por razões diversas, concretizáveis por nenhum dos quatro 

extractores com os quais se compara o SMX. No entanto, elas são realizáveis com o 

SMX, dado que este se baseia numa abordagem FDM, em que se podem especificar todas 

as características geométricas do problema. Os outros quatro extractores, por se basearem 

numa aproximação BEM, fazem algumas aproximações. Uns assumem que o substrato 

é infinito em área, ou mesmo em profundidade, outros não permitem a especificação da 

profundidade dos contactos e por isso não é possível especificar as configurações de teste 

pretendidas. 

5.2.1 Condutância entre um contacto e o backplane 

Nesta configuração básica de teste, foram utilizados o layout e perfil de substrato apre- 

sentados na Figura 5.1. Calculando manualmente a resistência que liga o contacto ao 

backplane tem-se: 

R¡ρ l 100 1061 106 

(5.1) 

S015 

9999 1069999 106¡148529kΩ 

O SMX obtém o resultado RSMX¡1484923 10 5¡148492 kΩ com a discretização 

mínima de 5 5 3. Esta configuração é tão simples que mesmo com discretizações mais 

finas a resistência extraída não se altera. A diferença para o valor calculado manualmente 

deve-se a ligeiras aproximações feitas nos cálculos e na geometria do layout. 

5.2.2 Condutância entre dois contactos 

Nesta segunda configuração, o layout e o perfil de substrato usados estão apresentados na 

Figura 5.2. Neste caso não se utilizou backplane e a resistência que se extraiu entre os 

dois contactos é de:

5.2. CONFIGURAÇÕES DE TESTE 77 

10 

10 

10 

Contacto que ocupa praticamente toda 

a area do substrato (9.999 x 9.999) 

1 

Condutividade 

de 15 Ohm.cm 

100 

backplane 

Figura 5.1: Configuração de teste 1. 

Vista de topo Vista lateral 

10 

30 

Condutividade 

de 1 Ohm.cm 


10002 106 

R001 

(5.2) 

9999 1069999 106¡10004kΩ 

Para esta configuração, o SMX extraiu uma resistência RSMX¡1000100 103¡ 10001 kΩ entre os dois contactos. 

5.2.3 Variação da Profundidade dos Contactos 

O layout e perfil de substrato utilizados nas restantes experiências apresentam-se na Figu- 

ra 5.3. Nesta terceira experiência variou-se a profundidade dos contacto e retirou-se o 

valor da resistência do contacto para o backplane. Os resultados apresentam-se na Tabela 

5.1 para os vários extractores. As entradas assinaladas com (a) referem-se a experiências 

irrealizáveis, dado que os extractores Xtract, Subx, Space e SubQuick não permitem a 

especificação do valor da profundidade dos contactos. Isto deve-se a que estas quatro 

ferramentas se baseiam numa formulação BEM, em que os contactos são apenas dis- 

cretizados na superfície do substrato e, como tal, é assumido que a sua profundidade é 

10


infinitesimal. 

2x2 

a x b backplane 

Figura 5.3: Configuração para Comparação dos Extractores. 

Pelos resultados apresentados, verifica-se que o extractor que apresenta resultados 

mais aproximados aos do SMX é o Xtract. Pode observar-se que à medida que se diminui 

a profundidade do contacto na experiência com o SMX, o valor obtido se aproxima do 

valor obtido pelo Xtract, exactamente por este último considerar que os contactos têm 

profundidade infinitesimal. 

As diferenças de valores que se verificam neste exemplo, bem como nos próximos, en- 

tre o SMX e o Xtract e os outros três extractores podem ter várias explicações. Uma delas 

é que se tratam de ferramentas de abordagens diferentes. Todas elas, excepto o SMX, 

seguem abordagens BEM. No Xtract foram utilizadas a função de Green para caracterizar 

o substrato e uma discretização uniforme. 

5.2.4 Variação da Profundidade do Substrato 

Nesta experiência variou-se a profundidade do substrato e retirou-se novamente a re- 

sistência de acoplamento para o backplane. Os resultados encontram-se na Tabela 5.2. 

As entradas preenchidas com (b) representam experiências impossíveis de realizar, dado 

que o Space não permite a especificação de um valor para a profundidade máxima do 

substrato, embora permita a utilização de um máximo de duas camadas. Verifica-se que 

os valores obtidos mantêm a sua ordem de grandeza em relação à experiência anterior, 

havendo uma diferença aproximadamente constante entre os extractores SMX e Xtract. 

0 

d 

D


Profundidade do Contacto (µm) SMX Xtract Subx Space SubQuick 

infinitesimal - 264062 21759 4208228 1497415 

0.001 253077 (a) (a) (a) (a) 

0.01 252937 (a) (a) (a) (a) 

0.1 251687 (a) (a) (a) (a) 

1 244755 (a) (a) (a) (a) 

2 240920 (a) (a) (a) (a) 

4 237377 (a) (a) (a) (a) 

Tabela 5.1: Comparação entre os resultados dos vários extractores para diferentes pro- 

fundidades de contacto. Valores das resistências em Ω. As entradas assinaladas com (a) 

referem-se a experiências irrealizáveis, dado que os extractores Xtract, Subx, Space e 

SubQuick não permitem a especificação do valor da profundidade dos contactos. 

Profundidade do Substrato (µm) SMX Xtract Subx Space SubQuick 

100 69253 88281 21635 (b) 1321633 

200 127645 146874 21717 (b) 1380227 

300 186281 205468 21745 (b) 1438821 

400 244755 264062 21759 (b) 1497415 

infinita - - - 4208228 - 

Tabela 5.2: Comparação entre os resultados dos vários extractores para diferentes pro- 

fundidades do substrato. Valores das resistências em Ω. As entradas preenchidas com 

(b) representam experiências impossíveis de realizar, dado que o Space não permite a 

especificação de um valor para a profundidade máxima do substrato, embora permita a 

utilização de um máximo de duas camadas.


Resistividade do Substrato (Ωcm) SMX Xtract Subx Space SubQuick 

0.001 16 18 1 281 100 

0.1 1632 1760 145 28055 9983 

1 16317 17604 1451 280550 99828 

15 244755 264062 21759 4208228 1497415 

20 326342 352083 29012 5610998 1996553 

Tabela 5.3: Comparação entre os resultados dos vários extractores para diferentes resis- 

tividades do substrato. Valores das resistências em Ω. 

5.2.5 Variação da Resistividade do Substrato 

Nesta experiência variou-se a resistividade da única camada do substrato da configuração 

em análise. Todas as ferramentas permitem, obviamente, a especificação deste valor. Os 

resultados obtidos estão na Tabela 5.3. Tal como nas experiências anteriores, existe uma 

maior coerência entre os valores obtidos pelos extractores SMX e Xtract. No entanto, 

todas as ferramentas apresentam uma evolução linear com o aumento da resistividade do 

substrato. 

5.2.6 Variação da Área do Substrato 

Nesta experiência variou-se a dimensão da área do substrato. Os resultados encontram-se 

na Tabela 5.4. As entradas marcadas com (c) referem-se a experiências que não se pude- 

ram realizar, dado que o Subx e o Space não permitem a especificação de valores para as 

dimensões x e y do substrato. Pelos resultados, observa-se que existe ainda uma conside- 

rável semelhança entre os valores obtidos pelos extractores SMX e Xtract. Contudo, este 

último extractor tem tendência a cometer erros maiores quando a dimensão dos contactos 

é consideravelmente inferior à área do substrato. Isto ocorre, porque o Xtract se baseia no 

cálculo da transformada discreta de co-seno, DCT, para obter a função de Green que des- 

creve o comportamento electromagnético do substrato. Quando os contactos são muito 

pequenos face à área do substrato, as aproximações feitas em [4] são erróneas e a DCT 

(função de Green) é calculada com menor precisão. Devido a isto, pensa-se que os va- 

lores obtidos pelo Xtract para dimensões da área do substrato sucessivamente maiores se 

afastam da realidade, ao contrário do que acontece com o SMX, como se parece verificar


Área do Substrato (µm 2 ) SMX Xtract Subx Space SubQuick 

16 16 244755 264062 (c) (c) 1497415 

32 32 70629 123354 (c) (c) 690114 

64 64 25580 68373 (c) (c) 330408 

128 128 12183 55561 (c) (c) 161542 

infinita - - 21759 4208228 - 

Tabela 5.4: Comparação entre os resultados dos vários extractores para diferentes di- 

mensões da área do substrato. Valores das resistências em Ω. As entradas marcadas com 

(c) referem-se a experiências que não se puderam realizar, dado que o Subx e o Space não 

permitem a especificação de valores para as dimensões x e y do substrato. 

2x2 

d 

2x2 

64 x 32 um^2 

15 Ohm.cm 

0 

1 um 

400 um 

Figura 5.4: Configuração com dois contactos para comparação entre extractores. 

pela Tabela 5.4. 

5.2.7 Variação da Distância entre Contactos 

Para comparar os diferentes extractores na extracção do acoplamento entre dois contactos, 

foi usada a configuração da Figura 5.4. Na Tabela 5.5 são apresentados os valores das re- 

sistências de acoplamento entre os dois contactos, sem influência de backplane, conforme 

se varia a distância entre eles. As entradas assinaladas com (d) devem-se a não ter sido 

possível executar o SubQuick com backplane flutuante. 

Nesta experiência detecta-se algum desacordo entre o SMX e o Xtract, que anterior- 

mente apresentaram valores bastante coerentes, embora todas as ferramentas apresentem 

uma evolução semelhante com a distância.


Distância entre contactos (µm) SMX Xtract Subx Space SubQuick 

4 15179 692 76414 28763230 (d) 

8 21561 890 159295 58891010 (d) 

12 24058 1155 241972 88714460 (d) 

16 25188 1500 325550 118462100 (d) 

20 26014 1897 410214 148179600 (d) 

Tabela 5.5: Comparação entre os resultados dos vários extractores conforme a distância 

entre os dois contactos. Valores das resistências em Ω. As entradas assinaladas com (d) 

devem-se a não ter sido possível executar o SubQuick com backplane flutuante. 

2x2 

d 

2x2 

220x200 

15 Ohm.cm 


5.3 Estudo Eléctrico dos Efeitos de Acoplamento 

Nesta secção faz-se um estudo eléctrico dos efeitos de acoplamento usando a ferramenta 

SMX. Este estudo tem como objectivos verificar a correcção e a precisão da ferramenta, 

e demonstrar a sua utilidade como instrumento de auxílio ao projecto de circuitos em que 

o ruído propagado pelo substrato tem especial relevância. 

5.3.1 Posicionamento dos Contactos 

Para verificar como varia a resistência de acoplamento entre dois contactos à medida que 

se varia a distância entre eles foi usada a configuração da Figura 5.5. Variou-se a distância 

d entre 4 e 20 µm de 2 em 2 µm, estando os resultados na Tabela 5.6. A evolução da 

resistência extraída pode observar-se melhor no gráfico da Figura 5.6. 

A equação que rege o campo eléctrico E a uma distância x de uma carga pontual q1 

0 

1 

100

5.3. ESTUDO ELÉCTRICO DOS EFEITOS DE ACOPLAMENTO 83 

Distância (µm) Resistência extraída (kΩ) 

4 21.530 

6 25.504 

8 27.358 

10 28.469 

12 29.241 

14 29.758 

16 30.110 

18 30.413 

20 30.690 

Tabela 5.6: Variação da resistência extraída entre dois contactos consoante a distância 

entre eles. 

situada em x1 é dada por [42, 43]: 

E¢x¤¡kq1 

xx1 

xx13 

(5.3) 

em que k é uma constante de proporcionalidade que depende do sistema de unidades 

utilizado. Como: 

φ¡∇ E 

(5.4) 

o potencial eléctrico varia com o inverso da distância. É, portanto, de esperar que a 

resistência de acoplamento entre os dois contactos aumente com a distância entre eles, 

como se pode confirmar pela Figura 5.6. 

5.3.2 Dimensão dos Contactos 

Para se verificar como varia a resistência de acoplamento entre dois contactos à medida 

que se varia a dimensão dos contactos, foi usada a configuração da Figura 5.7. Variou-se 

a dimensão D de cada contacto em cada dimensão entre 1 e 8 µm de 1 em 1 µm. Os 

resultados apresentam-se na Tabela 5.7. A evolução da resistência extraída pode obser- 

var-se melhor no gráfico da Figura 5.8.


Resistência (Ohm) 

x 104 

3.1 

3 

2.9 

2.8 

2.7 

2.6 

2.5 

2.4 

2.3 

2.2 

2.1 

4 6 8 10 12 

Distância (um) 

14 16 18 20 

Figura 5.6: Evolução da resistência entre dois contactos conforme se varia a distância 

entre eles. 

Verifica-se que a resistência de acoplamento entre os dois contactos diminui à medida 

que a sua dimensão aumenta, tanto porque a sua distância relativa diminui, como porque 

há mais volume de injecção e recepção de corrente. 

5.3.3 Utilização de Backplane 

Para se ter uma noção da capacidade de escoamento do backplane utilizou-se a configu- 

ração da Figura 5.5. Os resultados, com e sem backplane encontram-se na Tabela 5.8. 

Pode ver-se em que medida é que o backplane pode intervir na diminuição do acopla- 

DxD 

20 

DxD 

220x200 

15 Ohm.cm 


0 

D 

100


Dimensão (µm) Resistência extraída (kΩ) 

1 46.960 

2 23.431 

3 15.083 

4 10.857 

5 8.287 

6 6.573 

7 5.357 

8 4.422 

Tabela 5.7: Variação da resistência extraída entre dois contactos consoante a dimensão 

dos contactos. 


50 

45 

40 

35 

30 

25 

20 

15 

10 

5 

0 

1 2 3 4 5 6 7 8 

Dimensão dos Contactos (um) 

Figura 5.8: Evolução da resistência entre dois contactos conforme se varia a dimensão de 

ambos. 

Resistência Resistência dos contactos 

entre contactos para o backplane 

Sem backplane 3.069000e+04 - 

Com backplane 2.519797e+05 1.631595e+04 

Tabela 5.8: Variação da resistência extraída entre dois contactos com e sem backplane.


1 

1 

2 

2 

2 

1 

20 

2x2 2x2 

220x200 

Figura 5.9: Configuração de teste 5a. O substrato tem 100 µm de profundidade e uma 

resistividade de 15 Ω cm. 

mento resistivo entre os dois contactos. Isto deve-se ao surgimento das resistências de 

escoamento de corrente. Neste caso, o backplane aumentou em mais de oito vezes o 

isolamento entre os dois contactos. 

5.3.4 Utilização de Guard-rings 

Para verificar a eficácia da utilização dos anéis de guarda na protecção de um contacto 

utilizou-se a configuração da Figura 5.9. 

Nesta primeira experiência não se fechou completamente o anel de guarda em torno 

do contacto. A palavra “anel” é, neste caso, um abuso de linguagem. Como se pode 

ver pela Tabela 5.9, este tipo de anel de guarda é relativamente eficaz no resguardo do 

contacto da esquerda. Para uma profundidade do anel de cerca de 5 µm o isolamento é 

praticamente perfeito. 

Para testar a eficácia de um anel de guarda totalmente fechado em torno do contacto 

a resguardar usou-se a configuração da Figura 5.10. Com este tipo de anel, como se 

pode ver pela Tabela 5.10, o isolamento com uma profundidade de 3 µm é já superior ao 

isolamento com o anel de 10 µm do exemplo anterior. 

Conclui-se que com uma fronteira de resguarda não totalmente fechada em torno do 

contacto a proteger, ainda há linhas de força que contornam a barreira e conseguem 

alcançar o contacto semi-protegido. Um anel de guarda concêntrico é, como foi visto,


Profundidade do Resistência 

guard-ring entre contactos 

1 2.982312e+05 

2 1.878022e+06 

3 3.558823e+07 

4 7.655636e+08 

5 1.475346e+09 

6 4.306491e+09 

7 5.278579e+09 

8 5.476009e+09 

9 1.093519e+10 

10 9.999258e+09 

Tabela 5.9: Variação da resistência extraída entre dois contactos consoante a profundidade 

da barreira de resguarda usada. 

1 

1 

2 

2 

2 

1 

20 

2x2 2x2 

220x200 

Figura 5.10: Configuração de teste 5b. O substrato tem 100 µm de profundidade e uma 

resistividade de 15 Ω cm.


Profundidade do Resistência 

guard-ring entre contactos 

1 3.986418e+05 

2 5.615993e+08 

3 1.263709e+11 

4 1.860408e+12 

Tabela 5.10: Variação da resistência extraída entre dois contactos consoante a profundi- 

dade do guard ring usado. 

Perfil do Resistência Resistência de cada contacto 

Substrato entre contactos para o backplane 

A 3.055971e+02 3.128384e+02 

B 8.570429e+03 9.855343e+02 

C 3.210020e+04 1.078632e+04 

Tabela 5.11: Comparação das resistências extraídas para três perfis de substrato difer- 

entes. 

mais vantajoso, pois permite ter um isolamento superior para uma profundidade mais 

reduzida. 

Pelo gráfico da Figura 5.11 percebe-se ainda que existe uma profundidade do guard- 

ring a partir da qual pouco se ganha em termos de isolamento. No caso em análise essa 

profundidade é de cerca de 4 µm. 

5.3.5 Perfil do Substrato 

Para verificar a influência dos vários perfis possíveis para o substrato utilizaram-se três 

perfis diferentes, ilustrados na Figura 5.12, todos eles com backplane. Sobre estes três 

tipos de substrato utilizou-se a configuração da Figura 5.5 com d¡20 µm e extraiu-se 

a resistência de acoplamento entre os dois contactos. Os resultados apresentam-se na 

Tabela 5.11. 

Na análise dos resultados obtidos nesta experiência, pode ser enganador comparar as 

resistências de acoplamento entre diferentes perfis do substrato. A diferença de carac-



10 11 

10 10 

10 9 

10 8 

10 7 

10 6 

10 

1 2 3 4 5 6 7 8 9 10 

5 

Profundidade do guard−ring (um) 

Figura 5.11: Evolução da resistência entre dois contactos conforme se varia a profundi- 

dade do guard-ring. 

1u 

400u 

0.1 Ohm.cm 

20 Ohm.cm 

1u 

10u 

300u 

1 Ohm.cm 

15 Ohm.cm 

1 mOhm.cm 

400u 

15 Ohm.cm 

A B C 

Figura 5.12: Perfis de substrato.


terísticas dos vários tipos de substrato origina diferenças de valor que tornam a compa- 

ração, por isso mesmo, difícil. No entanto, pode sempre comparar-se a resistência entre 

contactos com a resistência para o backplane em cada caso isoladamente. Fazendo isso, 

verifica-se que no caso do perfil A, a corrente injectada num contacto distribui-se de for- 

ma aproximadamente uniforme entre o outro contacto e o backplane, pois as resistências 

têm valores semelhantes. Por outro lado, no caso do perfil B, a resistência entre contac- 

tos é cerca de dez vezes superior à resistência para o backplane, o que indica que, neste 

substrato, a corrente tenda a ser facilmente escoada para o backplane e, como tal, o isola- 

mento entre os contactos é melhor. Esta melhoria no isolamento entre contactos, deve-se 

ao facto de o substrato ser de baixa resistividade. Em relação ao perfil C, a tendência 

mantém-se: a resistência entre contactos é cerca de três vezes superior à resistência para 

o backplane, pelo que este perfil apresenta um isolamento não tão bom como o perfil C, 

mas melhor que o perfil A. 

Em conclusão, observa-se o melhor isolamento no caso do substrato do tipo B, sendo 

também o mais dispendioso de fabricar. A camada superior nos perfis A e B tem como 

objectivo impedir a formação de canal entre contactos de transístores distintos (channel- 

stop region), mas em termos de acoplamento contribui para um menor isolamento entre 

contactos. É portanto uma técnica com vantagens e desvantagens, sendo a desvantagem 

em termos de acoplamento suplantada no caso do perfil B, uma vez que se utiliza um 

substrato de baixa resistividade. 

5.3.6 Distância de um contacto aos limites do substrato 

A existência de dispositivos para efeitos de protecção de circuitos contra Electrical Over- 

stress e Electrostatic Discharge comporta o implante dos dispositivos de protecção junto 

aos pads do circuitos, i.e., junto ao limite do substrato. De modo a poder analisar o efeitos 

das linhas de força relativas a um contacto perto da orla do substrato, utilizou-se o layout 

da Figura 5.13. 

Nesta configuração variou-se a distância e de 2 a 20 µm de 1 em 1 µm, extraindo-se 

para cada caso o valor da resistência entre os contactos. Os resultados apresentam-se na 

Tabela 5.12. 

Como se pode ver, a resistência de acoplamento entre os dois contactos altera-se si-


e 

2x2 

20 

2x2 

220x200 

15 Ohm.cm 


Distância ao Resistência 

limite do substrato entre contactos 

2 2.166849e+04 

3 2.043893e+04 

4 1.957601e+04 

6 1.881332e+04 

8 1.852323e+04 

10 1.825810e+04 

12 1.806643e+04 

Tabela 5.12: Evolução da resistência entre dois contactos face à proximidade de um deles 

do limite geométrico do substrato. 

0 

1 

100


gnificativamente (mais de 20%) conforme a distância a que o contacto se encontra do 

limite do substrato. Isto revela que os métodos de extracção que assumem que o substrato 

é infinito em x e y (Subx e Space) não são eficazes em tratar problemas em que existem 

contactos junto à orla do substrato. Problemas em que existem contactos perto do substra- 

to são comuns, pelo que nestes casos é de esperar que o SMX produza resultados muito 

mais precisos que o Subx, o Space e ferramentas que assumam os limites do substrato 

como sendo infinitos. 

5.4 Exemplo de Circuito de Complexidade Industrial 

Com o objectivo de experimentar a aplicação da ferramenta desenvolvida na extracção 

do modelo de um circuito de complexidade industrial, foi utilizada a PLL cujo layout 

se apresenta na Figura 5.14. Este circuito foi anteriormente apresentado e utilizado em 

[30, 4, 8, 9]. Os valores obtidos para o acoplamento entre os quatro primeiros contactos 

do layout analisado apresentam-se na Tabela 5.13. As medidas relativas aos recursos 

computacionais necessários para a extracção deste modelo encontram-se na Tabela 5.14. 

Fez-se uma estimativa do custo total de extracção dos 471 contactos do circuito e 

prevê-se que este poderia exigir entre 5 e 6 dias. No entanto, a discretização utiliza- 

da é extremamente elevada (513 257 5). Pelos requisitos de memória exigidos pela 

discretização empregue, conclui-se que não seria possível aumentar o número de cortes 

em qualquer uma das três dimensões, dado que nesse caso a memória necessária dupli- 

caria e a quantidade de memória disponível nas máquinas de teste era de somente 1.5 

GB. 

Naturalmente, esta extracção, pelo elevado custo temporal que acarreta, só faz senti- 

do ser executada sobre o circuito final. Em fases de projecto anteriores, utilizar-se-iam 

discretizações menos finas, obtendo-se uma menor precisão, mas uma extracção bastante 

mais rápida. Por outro lado, presume-se que, caso fosse possível aumentar a discretização, 

sobretudo na direcção z, o modelo final teria ainda uma maior precisão.

5.4. EXEMPLO DE CIRCUITO DE COMPLEXIDADE INDUSTRIAL 93 

Figura 5.14: Layout do circuito de complexidade industrial (PLL) utilizado para teste. 

Nome da Contacto Contacto Valor da 

Resistência 1 2 Resistência (Ω) 

R10 1 backplane 5042.5 


R12 1 2 259.3659 


R13 1 3 4170.0 

R23 2 3 181.6250 


R14 1 4 7485.0 

R24 2 4 200.3673 

R34 3 4 10967 

Tabela 5.13: Conjunto seleccionado de resistências de acoplamento para o circuito da 

PLL obtidas com o SMX.


Extracção do Acoplamento pelo Substrato da PLL 

Discretização 513 257 5 

Dimensão do Sistema 659205 

Tempo de Setup 452.10 s 

Tempo de Extracção (10 contactos) 9854.49 s 

Tempo Total de Execução (10 contactos) 10309.76 s 

Requisitos de Memória 846420 kB 

Estimativa do Tempo Total de Execução (471 contactos) 5 dias e 9 horas 

Tabela 5.14: Recursos computacionais necessários para a extracção do modelo de acopla- 

mento pelo substrato relativo ao circuito da PLL. Valores obtidos num Pentium III a 1200 

MHz com 256 kB de cache e 1.5 GB de RAM.

Capítulo 6 

Comparação Entre Métodos 

Para efeitos de comparação do desempenho dos métodos numéricos experimentados neste 

trabalho, elaboraram-se dois problemas de configuração simples. Sobre estes problemas 

foram testados os diferentes algoritmos para vários níveis de discretização. 

As figuras de mérito utilizadas para qualificar o desempenho dos algoritmos foram: 

número de iterações, memória máxima utilizada e tempo total de execução. Foram também 

analisados os tempos por iteração e de setup de cada algoritmo e feito um estudo sobre a 

evolução da norma do resíduo e a complexidade experimental obtida para alguns métodos. 

6.1 Configurações de Teste 

6.1.1 Um Contacto Com Backplane 

Na Figura 6.1 representa-se a vista superior do layout usado neste primeiro problema, 

sendo o correspondente perfil do substrato esquematizado na Figura 6.2. O desempenho 

dos algoritmos testados está sumariado nas Tabelas 6.1, 6.2, 6.3 e 6.4. 

Os algoritmos baseados em Multigrid são de longe os que apresentam o menor número 

de iterações. O custo deste tipo de algoritmos está no tempo de cada iteração e não no 

número total de iterações do algoritmo. Por outro lado, os restantes métodos são de 

iteração rápida (exigem basicamente uma multiplicação matriz-vector), mas apresentam 

um relativamente elevado número de iterações. 

Em termos de tempo de execução, verifica-se que o reduzido número de iterações 

que os algoritmos MG apresentam é, neste caso, acima de compensatório. Mesmo tendo 

95

96 CAPÍTULO 6. COMPARAÇÃO ENTRE MÉTODOS 

100 

Figura 6.1: Layout da configuração de um contacto com backplane. 

1 

100 

2x2 

100 

100 

condutividade = 20 Ohm.cm 

100 

backplane 

Figura 6.2: Perfil do substrato da configuração de um contacto com backplane. 

Método 9 9 5 17 17 9 33 33 17 65 65 33 129 129 65 

GE (405) (2601) (18513) (139425) (1081665) 

GS 1437 1876 3646 10188 32647 

GMRES 62 83 104 183 348 

CG 75 96 132 189 290 

PGMRES 11 17 29 47 87 

PCG 10 16 29 46 88 

MG 21 13 7 4 3 

FMG 25 14 7 4 3 

MGPCG 7 5 4 3 3 

Tabela 6.1: Comparação do número de iterações dos diversos métodos testados para 

uma configuração com um contacto. Os valores entre parênteses referem-se ao número 

de passos do processo de eliminação gaussiana, sendo numericamente iguais à dimensão 

do sistema para cada caso.



GE 0.17 38.25 4386.39 - - 

GS 0.11 4.67 82.62 1803.37 45299.01 

GMRES 0.02 0.27 7.09 144.27 2125.82 

CG 0.01 0.19 2.55 31.20 369.14 

PGMRES 0.00 0.09 1.46 29.85 617.18 

PCG 0.01 0.08 1.09 13.52 189.30 

MG 0.03 0.38 2.65 18.55 140.20 

FMG 0.04 0.44 2.87 19.14 142.24 

MGPCG 0.03 0.29 2.26 17.09 136.08 

Tabela 6.2: Comparação do tempo de execução (s) dos diversos métodos testados para 

uma configuração com um contacto. As entradas não preenchidas referem-se a ex- 

periências que não se realizaram por serem demasiado demoradas e não terem grande 

interesse prático. 

um custo de tempo por iteração muito superior ao do PCG (Tabela 6.3), o MG consegue 

superá-lo em termos de tempo total de execução. 

Verifica-se que o MG é, neste caso, um bom pré-condicionador para o PCG, pois o 

MGPCG é de todos os algoritmos o mais rápido, apresentando um ganho de aproximada- 

mente 28% face ao PCG. 

A mais valia em termos de tempo de execução do MG é paga à custa de uma maior 

quantidade de memória necessária para correr o algoritmo (Tabela 6.4). É de relembrar 

que o MG precisa de uma representação em memória dos sistemas Ahxh¡bh em todos 

os níveis h, se bem que, à medida que se progride de nível para nível, a complexidade 

do sistema se vai reduzindo em cerca de 8 vezes por nível. Além disto, há que guardar 

para cada nível, excepto para o inferior, os operadores de projecção e interpolação. Estas 

razões levam a que os algoritmos baseados em MG apresentem uma ocupação de memória 

que é cerca do dobro da necessária pelo PCG e cerca do quádruplo da necessária pelo GS. 

Esta é, de facto, a maior desvantagem do MG, dado que tipicamente os recursos de 

memória das estações de trabalho actuais não ultrapassam os 3 GB e isso restringe a 

utilização de MG a discretizações de 257 129 129 ou equivalentes.


Método 33 33 17 65 65 33 129 129 65 

GS 0.02 0.18 1.39 

GMRES 0.07 0.78 6.09 

CG 0.02 0.16 1.24 

PGMRES 0.04 0.60 6.95 

PCG 0.03 0.26 2.01 

MG 0.14 1.27 10.82 

FMG 0.17 1.43 11.51 

MGPCG 0.15 1.28 9.88 

Tabela 6.3: Comparação do tempo de iteração (s) dos diversos métodos testados para 

uma configuração com um contacto. 


GE 2848 29144 755760 - - 

GS 1740 2264 5476 29756 216792 

GMRES 2160 4476 21100 146572 1121744 

CG 1756 2392 6784 39572 292860 

PGMRES 2224 4916 24256 170412 1307140 

PCG 1800 2692 8924 55776 419088 

MG 1944 3660 15632 105876 802676 

FMG 1944 3660 15632 105876 802676 

MGPCG 1944 3660 15632 105876 802676 

Tabela 6.4: Comparação da memória (kB) ocupada pelos diversos métodos testados 

para uma configuração com um contacto. As entradas não preenchidas referem-se a ex- 


interesse prático.


Os GMRES e PGMRES apresentam ainda valores de ocupação de memória superiores 

aos dos algoritmos baseados em MG, dado que reservam, no caso da implementação 

utilizada, uma sobrestimativa de memória necessária para os vectores de ortogonalização 

ao longo das várias iterações. 

Em relação às versões pré-condicionadas dos algoritmos GMRES e CG, verifica-se 

que estas introduzem um acréscimo no tempo gasto por iteração, mas proporcionam um 

menor número de iterações. Esta troca é vantajosa em termos de tempo, pois o PGMRES 

resolve o problema em cerca de 29% do tempo do GMRES e o PCG em cerca de 51% do 

tempo do CG. 

O facto dos GMRES e PGMRES apresentarem números de iterações e tempos bas- 

tante piores que os correspondentes CG e PCG, está relacionado com o processo de 

recomeço (restarting) dos algoritmos baseados em GMRES [41]. Nesta implementação 

do GMRES faz-se o recomeço do algoritmo de m em m iterações, sendo este parâmetro m 

especificado à priori. Caso se escolha um parâmetro m elevado, pode não existir memória 

suficiente para o GMRES correr, dado que ele aloca uma matriz densa de m N en- 

tradas, em que N é a dimensão do sistema. Se, pelo contrário, se escolher um valor 

reduzido para m, o algoritmo faz recomeços frequentes, o que pode piorar a sua con- 

vergência. Nos testes apresentados usou-se m¡100, o que pareceu ser um valor razoável. 

Verificou-se experimentalmente que diferentes valores de m conduzem a diferentes tem- 

pos de execução, como se pode ver pela Tabela 6.5. Contrariamente ao que se possa 

pensar, a experiência com m¡50 revela o melhor tempo de execução, pois a pesquisa da 

solução é feita por ortogonalização com uma máximo de 50 vectores, enquanto que com 

m¡150 é necessário fazer as contas com todos os vectores obtidos até então (150 nas 

pior das hipóteses). Isto faz com que com o menor valor de m se tenha o menor custo por 

iteração e, como tal, mesmo com um número de iterações superior, o tempo de execução 

é menor. No entanto, há-de existir um limite inferior para m, para o qual o algoritmo não 

convergirá, dado que o GMRES só é garantido convergir caso não haja restart. 

Os tempos de setup dos vários algoritmos apresentam-se na Tabela 6.6, onde se pode 

ver que os algoritmos baseados em MG apresentam tempos de setup quase dez vezes 

superiores aos dos outros métodos. Estes elevados tempos de setup devem-se aos cálculos 

dos operadores de projecção e interpolação e das matrizes de sistema nos vários níveis.


Número de iterações Número total Tempo de Memória 

antes do restart de iterações execução (s) ocupada (kB) 

50 235 108.79 84244 

100 183 148.79 138768 

150 144 175.56 193336 

Tabela 6.5: Influência do processo de restarting no desempenho do GMRES. 

Método 17 17 9 33 33 17 65 65 33 129 129 65 

PGMRES 0.03 0.21 1.61 12.53 

PCG 0.03 0.22 1.62 12.67 

MG 0.21 1.70 13.47 107.73 

FMG 0.21 1.70 13.44 107.71 

MGPCG 0.21 1.65 13.25 106.43 

Tabela 6.6: Comparação do tempo de setup (s) dos diversos métodos testados para a 

configuração com um contacto. Para os métodos PGMRES e PCG a fase de setup com- 

preende o cálculo da matriz de pré-condicionamento. No caso do MGPCG trata-se do 

tempo de setup do MG. 

Os métodos pré-condicionados apresentam ainda um acréscimo no tempo de setup em 

relação aos métodos não pré-condicionados devido ao tempo de cálculo da matriz de 

pré-condicionamento, que, neste trabalho, corresponde a uma factorização incompleta de 

Cholesky. 

6.1.2 Dois Contactos Sem Backplane 

Na Figura 6.3 apresenta-se a vista superior do layout correspondente a esta segunda 

configuração de teste, sendo o perfil do substrato representado na Figura 6.4. O de- 

sempenho dos algoritmos testados está patente nas Tabelas 6.7, 6.8, 6.9. As entradas 

preenchidas com um traço correspondem a experiências de execução muito demorada e 

sem grande interesse prático, pelo qual não foram concluídas. 

No que toca ao número de iterações, o MG e afins voltam a ser os algoritmos que 

detêm os melhores resultados. Estes algoritmos apresentam, aliás, um número de iterações


100 

100 

100 

20 

100 

2x2 2x2 

Figura 6.3: Layout da configuração de dois contactos sem backplane. 

1 1 

100 

condutividade = 20 Ohm.cm 

100 

100 

backplane 

Figura 6.4: Perfil do substrato da configuração de dois contactos sem backplane. 


GE (765) (5049) (36465) (276705) (2154945) 

GS 191 1262 5466.5 16726 - 

GMRES 76 92.5 121 190 - 

CG 94.5 120.5 149 248.5 441 

PGMRES 12.5 21 34.5 62.5 114.5 

PCG 12 20 34 64 119.5 

MG 22.5 14 7 5 24 

FMG 23.5 14 8 6 10 

MGPCG 7 6 4.5 4 10 

Tabela 6.7: Comparação do número médio de iterações dos diversos métodos testados 

para uma configuração com dois contactos. As entradas não preenchidas referem-se a 

experiências que não se realizaram por serem demasiado demoradas e não terem grande 

interesse prático.



GE 2.27 284.31 40160.03 - - 

GS 0.06 14.42 502.06 11728.21 - 

GMRES 0.12 1.46 55.22 1064.31 - 

CG 0.03 0.99 11.72 157.64 2121.89 

PGMRES 0.02 0.39 8.73 186.35 3137.77 

PCG 0.01 0.33 4.77 67.23 935.43 

MG 0.26 5.60 218.70 51.18 924.41 

FMG 0.16 1.52 8.78 60.16 630.72 

MGPCG 0.08 0.84 6.05 45.51 533.32 

Tabela 6.8: Comparação do tempo de execução (s) dos diversos métodos testados para 

uma configuração com dois contactos. As entradas não preenchidas referem-se a ex- 



praticamente constante. Repare-se que a complexidade do problema aumenta em cerca de 

8 vezes de nível de discretização para nível de discretização, enquanto que os algoritmos 

baseados em MG apresentam uma evolução abaixo de linear (na ordem de constante). 

Em termos de tempo de execução, para este exemplo, o MG apresenta resultados na 

ordem do PCG, ainda que ligeiramente melhores. No entanto, o FMG continua a ser 

bastante melhor que o PCG. O MGPCG mantém-se claramente como o mais rápido de 

todos os métodos para problemas de elevada complexidade. 

6.2 Característica de Convergência dos Métodos 

Nesta secção apresenta-se a evolução da norma do resíduo para os algoritmos mais im- 

portantes. Pode ver-se pela Figura 6.5 que o Multigrid possui uma taxa de convergência, 

em termos práticos, constante. 

Na Figura 6.6 pode ver-se com maior pormenor a evolução da norma do resíduo para 

os algoritmos baseados em MG e para o PCG. Enquanto que os algoritmos Multigrid 

conseguem resolver o problema em cerca de 15 iterações, o PCG em igual número de

6.3. ANÁLISE EXPERIMENTAL DA COMPLEXIDADE DOS MÉTODOS 103 


GE 5696 103840 2951376 - - 

GS 1860 3024 11284 72888 - 

GMRES 3380 11240 68584 505560 - 

CG 1916 3380 13860 92356 700944 

PGMRES 2672 7904 46064 336444 336444 

PCG 2000 3956 18064 124512 952428 

MG 2440 6980 39712 286060 2207428 

FMG 2440 6980 39712 286060 2207428 

MGPCG 2488 7300 42016 303372 2342116 

Tabela 6.9: Comparação da memória (kB) ocupada pelos diversos métodos testados para 

uma configuração com dois contactos. As entradas não preenchidas referem-se a ex- 



iterações atingiu apenas uma norma de resíduo entre 1 e 0.1. No entanto, isto não significa 

que o MG seja sempre melhor que o PCG, dado que o factor tempo é também muito 

importante e cada iteração MG, como se viu, é muito demorada. 

O Multigrid Full-Cycle, ou Full Multigrid, apresenta a melhor evolução da norma 

do resíduo, sendo seguido pelo MG e só depois pelo MGPCG, que tem já bastante em 

comum com o PCG. Verifica-se, no entanto, que o facto de o PCG ser pré-condicionado 

pelo MG faz com que a sua característica de convergência seja muito mais parecida com 

a do MG do que com a do PCG. 

6.3 Análise Experimental da Complexidade dos Métodos 

6.3.1 Complexidade do Número de Iterações 

Na Figura 6.7 apresenta-se a evolução do tempo de execução dos métodos CG, PCG e 

MG segundo a complexidade do problema. Verifica-se que o CG apresenta uma evolução 

quadrática, enquanto que o PCG cresce linearmente. Por sua vez, o MG apresenta um 

número de iterações aproximadamente constante.


Conclui-se que o número de iterações do MG é independente da complexidade do 

problema [17, 18]. O aparente decréscimo do número de iterações do MG deve-se a 

variações geométricas originadas pelo aumento da discretização. 

6.3.2 Complexidade do Tempo de Execução 

A Figura 6.8 mostra a evolução do tempo de execução dos métodos CG, PCG e MG 

conforme o número de nós da grelha. Os declives das rectas do gráfico são de 36 

104 para o CG, 19 104 para o PCG e 13 104 para o MG. Como tal, é o MG 

que apresenta o melhor desempenho em termos de tempo para complexidades elevadas. 

Quanto maior for a complexidade do problema a resolver, maior é a vantagem em termos 

de tempo em usar MG. 

6.3.3 Complexidade do Tempo de Iteração 

Na Figura 6.9 pode ver-se a evolução do tempo gasto por iteração consoante a complexi- 

dade do problema a resolver. As curvas apresentadas na figura estão de acordo com os va- 

lores teóricos obtidos anteriormente: 13N para o CG, 19N para o PCG e 97N para o MG. 

O valor previsto para o MG é uma sobre-estimativa, dado que foram feitas aproximações 

por excesso no cálculo do número de operações aritméticas envolvidas nas operações de 

transferência inter-grelha. 

6.3.4 Complexidade dos Requisitos de Memória 

A evolução da quantidade de memória necessária pelos métodos consoante a dimensão 

do sistema a resolver, encontra-se representada na Figura 6.10. Constata-se que é neste 

aspecto que o MG tem o seu ponto fraco. A memória por ele ocupada excede os requisitos 

tanto do CG com do PCG. 

A memória ocupada pelo MG aumenta de forma mais brusca devido aos requisitos de 

memória adicionais para os operadores de projecção e interpolação. Os declives das rectas 

do gráfico são de 0.27 para o CG, 0.39 para o PCG e 0.74 para o MG. Estes resultados 

confirmam os resultados teóricos obtidos anteriormente, em que se previram os seguintes 

valores para os requisitos de memória: 12N para o CG, 19N para o PCG e 75N para o MG.


Novamente, o valor previsto para o MG é exagerado, pois, tal como foi dito, baseia-se em 

sobrestimativas do número de elementos dos operadores de projecção e interpolação e das 

matrizes de sistema.



10 2 

10 0 

10 −2 

10 −4 

10 −6 

10 −8 

10 −10 

GMRES 

CG 

PCG 

MG 

MGPCG 

10 

0 10 20 30 40 50 60 70 80 90 100 

−12 



10 2 

10 0 

10 −2 

10 −4 

10 −6 

10 −8 

10 −10 

(a) 

GMRES 

CG 

PCG 

MG 

MGPCG 

10 

0 10 20 30 40 50 60 70 80 90 100 

−12 



10 2 

10 0 

10 −2 

10 −4 

10 −6 

10 −8 

10 −10 

(b) 

GMRES 

CG 

PCG 

MG 

MGPCG 

10 

0 10 20 30 40 50 60 70 80 90 100 

−12 


(c) 

Figura 6.5: Evolução da norma do resíduo ao longo do número de iterações para 

discretizações de 33 33 17 (a), 65 65 33 (b) e 129 129 65 (c).


Norma do resíduo 

10 2 

10 0 

10 −2 

10 −4 

10 −6 

10 −8 

10 −10 

MG 

FMG 

MGPCG 

PCG 

10 

0 2 4 6 8 10 12 14 16 

−12 

Número de iterações 

Figura 6.6: Evolução da norma do resíduo conforme o número de iterações. 


300 

250 

200 

150 

100 

50 

10 2 

0 

10 3 

10 4 

10 5 

Número de Nós da Grelha 

10 6 

CG 

PCG 

MG 

Figura 6.7: Complexidade do número de iterações. 

10 7


Tempo de Execução (s) 

Tempo de Iteração (s) 

10 3 

10 2 

10 1 

10 0 

10 −1 

10 −2 

10 2 

10 1 

10 0 

10 −1 

10 −2 

10 −3 

10 2 

10 3 

10 4 

10 5 


Figura 6.8: Complexidade do tempo de execução. 

10 3 

10 4 

10 5 


Figura 6.9: Complexidade do tempo de iteração. 

10 6 

10 6 

CG 

PCG 

MG 

CG 

PCG 

MG 

10 7 

10 7


Requisitos de Memória (kB) 

10 6 

10 5 

10 4 

10 2 

10 3 

10 3 

10 4 

10 5 


Figura 6.10: Complexidade de memória. 

10 6 

CG 

PCG 

MG 

10 7

110 CAPÍTULO 6. COMPARAÇÃO ENTRE MÉTODOS

Capítulo 7 

Extracção de Modelos Dinâmicos 

Capacitivos 

A aproximação quase-estacionária feita no capítulo 2 é tradicionalmente aceite como 

sendo válida apenas para frequências de operação até cerca de 10 GHz, dado que o tem- 

po de relaxação do substrato é na ordem de 1012 s [15]. Dada a evolução tecnológica, 

verifica-se no entanto que se começa a tornar frequente o projecto de circuitos a operar a 

frequências mais elevadas. Coloca-se portanto, a questão sobre a validade dos modelos 

actualmente utilizados para o acoplamento pelo substrato e qual deverá ser a evolução dos 

mesmos. Para se obter um modelo preciso para frequências mais elevadas há que conside- 

rar as capacidades intrínsecas do substrato. É importante relembrar que se assumiu neste 

trabalho que os elementos capacitivos entre dispositivos e substrato, entre dispositivos e 

poços, e entre poços e substrato são obtidos por uma ferramenta externa e, portanto, são 

sempre tidos em consideração na simulação acoplada do circuito com o substrato. É ape- 

nas no que respeita ao modelo intrínseco de acoplamento pelo substrato que a questão se 

coloca. Embora a obtenção de modelos dinâmicos capacitivos caia fora do âmbito deste 

trabalho, será de seguida delineada e validada a forma como tal poderia ser realizado. 

7.1 Modelos RC 

Não se desprezando os efeitos capacitivos intrínsecos à propagação de correntes através 

do substrato, o modelo de acoplamento desejado é o que se exemplifica na Figura 7.1 

111

112 CAPÍTULO 7. EXTRACÇÃO DE MODELOS DINÂMICOS CAPACITIVOS 

para uma configuração com três contactos. O sistema correspondente a este modelo é 

representado por: 

R10 

dvc¢t¤ 

Cc 

(7.1) 

dt Gcvc¢t¤¡ic¢t¤ 

1 R12 2 R23 

3 

C10 

C12 

R20 

R13 

C20 

C13 

C23 

R30 C30 

Figura 7.1: Modelo RC para uma configuração de três contactos. 

em que Gc e Cc são, respectivamente, as matrizes de condutâncias e de capacidades de 

acoplamento entre contactos e ic e vc, respectivamente, as correntes e tensões nos contac- 

tos. 

De forma análoga ao que foi feito para os modelos puramente resistivos, a obtenção 

dos parâmetros do modelo desejado, Gc e Cc (matrizes de dimensão igual ao número de 

contactos), será feita utilizando o método das diferenças finitas. Neste método procede-se 

a uma discretização em volume que conduz a um sistema cuja resolução, utilizando fontes 

de excitação apropriadas, permite obter Gc e Cc. O modelo RC obtido desta forma é um 

modelo linear de primeira ordem que é exactamente aquilo com que os simuladores de 

circuitos estão habituados a lidar. 

Com o objectivo de considerar as capacidades intrínsecas do substrato, este passaria a 

ser modelado por uma rede tridimensional de resistências em paralelo com capacidades, 

i.e., uma malha RC, tal como está ilustrado na Figura 7.2 e como foi visto na equação 

(2.14). Utilizando a formulação do método nodal, o sistema tridimensional a resolver 

passaria então a ser: 

C dv¢t¤ 

(7.2) 

dt 

obviamente semelhante a (7.1), mas em que C e G são as matrizes com os elementos 

Gv¢t¤¡i¢t¤ 

capacitivos e resistivos da malha tridimensional representada na Figura 7.2 e v e i, respec-

7.1. MODELOS RC 113 

Figura 7.2: Modelo resistivo-capacitivo do substrato. 

tivamente, as tensões nos nós da malha e as correntes eventualmente injectadas nestes. 

Em regime alternado sinusoidal: 

do qual resulta: 

v¢t¤¡ReVejω1t¡Vejω1tφ1 

i¢t¤¡ReIejω2t¡Iejω2tφ2 

(7.3) 

¢GjωC¤Ve jω1tφ1¡Ie jω2tφ2 (7.4) 

Como o sistema é linear, ω1¡ω2ω, pelo que: 

¢GjωC¤Ve φ1¡Ie φ2¢GjωC¤V¡I (7.5) 

Tal como foi feito anteriormente, os parâmetros do modelo do substrato serão obtidos 

resolvendo (7.5) com excitações apropriadas. As tensões impostas nos nós dos contactos 

são transformadas pelo equivalente de Norton em correntes injectadas nos nós adjacentes 

aos contactos. Este processo é ilustrado na Figura 7.3 e é semelhante ao que foi feito para 

os modelos resistivos. Para simplificar os cálculos, e analogamente ao que foi feito aquan- 

do da obtenção dos modelos puramente resistivos, são impostas nos contactos tensões 

sinusoidais de frequência fixa ω, amplitude de 1V e desfasagem nula, que correspondem 

a correntes dadas por Ii¡¢Gi jjωCi j¤Vj¡¢Gi jjωCi j¤(Figura 7.3). As tensões dos 

nós i adjacentes aos nós j que pertencem aos contactos serão genericamente designadas 

por Vad j.


i 

Gij 

Cij 

j 

+ 

- 

Vj 

Gij 

i 

Cij 

Ii=(Gij+jwCij)Vj 

Figura 7.3: Esquema do equivalente de Norton para modelos resistivo-capacitivos. 

Assim sendo, a grandeza complexa I, que é a parte direita do sistema a resolver, é 

constituída por elementos nulos, correspondentes a nós sem fontes de corrente, e por 

elementos complexos, obtidos pelo equivalente de Norton e relativos aos nós da grelha 

tridimensional que estão directamente ligados aos contactos. 

Pode reescrever-se então o sistema tridimensional como sendo: 

¢GjωC¤¢VGjωVC¤¡IGjωIC 

(7.6) 

em que VG e ωVC são as partes real e imaginária de V e IG e ωIC as partes real e imag- 

inária de I. É importante notar a analogia de (7.6) com (2.14) caso se despreze o efeito 

capacitivo. 

Este sistema pode ser resolvido da mesma forma pela qual o sistema (2.15) era re- 

solvido anteriormente, havendo, no entanto, a necessidade de tratar todos os números 

como sendo complexos e de usar funções de factorização e resolução que tratem números 

complexos. Em alternativa, pode dividir-se a equação (7.6) nas suas partes real e imagi- 

nária, ficando com dois sistemas reais: 

GVGω 2CVC¡IG CVGGVC¡IC 

(7.7) 

No entanto, esta segunda forma de resolução de um sistema complexo é menos efi- 

ciente que a primeira [39] (basta observar que o sistema terá uma maior dimensão, com 

as consequentes repercussões nas propriedades numéricas das estruturas intervenientes e, 

claro, nos requisitos de recursos computacionais). 

Como foi visto anteriormente, o método usado para retirar a coluna i da matriz 

jωCc, que modela o acoplamento, é colocar o contacto i a uma tensão sinusoidal de am- Gc 

plitude fixa e recolher as correntes que entram nos outros contactos (e no backplane).

7.2. MODELOS RC PARA SUBSTRATOS COM APENAS UMA CAMADA 115 

Utilizando este processo, e depois de resolver o sistema (7.6), obtêm-se as tensões 

em todos os nós do substrato, pelo que se pode retirar as tensões nos nós adjacentes aos 

contactos, Vad j. Feito isto, calculam-se as correntes que entram em cada contacto através 

da fórmula: 

Ic¡Yad jVad j¡¢Gad jjωCad j¤Vad j 

(7.8) 

em que Yad j são as admitâncias correspondentes aos nós adjacentes aos contactos. Depois 

de determinado Ic pode retirar-se o modelo de acoplamento para o contacto i. Como o 

único contacto com tensão imposta não nula é o contacto i (vci¢t¤¡Vci e jωt , com Vci¡1V) 

da Equação (7.1) surge que as colunas i de Gc e Cc são obtidas por: 

ω 

Gci¡ReIc 

Cci¡ImIc 

(7.9) 

Ao contrário do caso dos modelos resistivos, neste caso as correntes que entram / 

saem de cada contacto são grandezas complexas, pelo que quando se forma a matriz de 

acoplamento, se obtêm uma condutância em paralelo com uma capacidade. A parte real 

das correntes dos contactos representa as condutâncias de acoplamento entre contactos, 

enquanto que a parte imaginária representa as capacidades. 

7.2 Modelos RC para Substratos com Apenas Uma Ca- 

mada 

No caso particular da análise do acoplamento em substratos com apenas uma camada, 

podem fazer-se algumas aproximações na resolução do sistema complexo a resolver. Os 

elementos de G podem ser calculados da seguinte forma: 

Quanto aos elementos de C tem-se: 

gi j¡σ Si j 

li j 

ci j¡ε Si j 

li j 

(7.10) 

(7.11)


Nos substratos com uma única camada, os parâmetros σ e ε podem considerar-se 

constantes em todo o substrato, pelo que para cada volume da malha tridimensional que 

discretiza o substrato: 

Deste resultado pode retirar-se que, no sistema (7.6): 

ci j 

(7.12) 

gi j¡σ 

εα 

C¡αG 

IC¡αIG 

(7.13) 

O sistema a resolver transforma-se então em (novamente com i¢t¤¡Ie jωt , 

V e v¢t¤¡ 

jωt e I¡IGjIC): 

¢GjωαG¤V¡IGjωαIGGV¡IG (7.14) 

Como se pode ver, não é necessário sequer criar a matriz C, dado que esta é igual à 

matriz G à parte o factor α (igual em sentido numérico; a interpretação física e as unidades 

são, naturalmente, diversas). A vantagem está no facto de que calcular V, neste caso 

particular, corresponde a resolver o sistema real (7.14), ao invés de um sistema complexo. 

Isto é um resultado extremamente vantajoso para substratos com uma camada, pois 

significa que com apenas uma resolução de um sistema real, tal como se fazia para a 

obtenção do modelo resistivo, obtém-se, praticamente sem custo adicional, um modelo 

resistivo-capacitivo. 

Depois de obter a matriz de condutâncias entre contactos, Gc, basta multiplicá-la por 

α, de modo a obter a matriz de capacidades entre contactos, Cc. Isto verifica-se, pois 

como Ic¡Yad jVad j e Yad j¡Gad jjωCad j: 

Gci¡ReIc¡Gad jVad j 

Cci¡ImIc 

ω 

¡Cad jVad j¡αGad jVad j¡αGci 

(7.15) 

Infelizmente, este resultado só se aplica a substratos de camada única, que não são os 

mais usados hoje em dia.

7.3. GAMA DE VALIDADE DO MODELO RC 117 

7.3 Gama de Validade do Modelo RC 

Nesta secção averigua-se sobre a gama de frequências para a qual os modelos dinâmicos 

propostos são válidos, bem como sobre a sua relevância e precisão. 

7.3.1 Relevância dos Modelos Dinâmicos 

Esta secção tem como objectivo verificar de forma simplificada a necessidade de utilização 

do modelo dinâmico proposto neste capítulo. Pretende-se, simultaneamente, mostrar que, 

no caso de substratos de camada única, é possível a obtenção do modelo de acoplamento 

com apenas uma resolução de sistema real do tipo GV¡IG. Para estes efeitos foi extraído 

o modelo RC do substrato do circuito apresentado na Figura 7.4. O modelo a obter é o 

que se ilustrou na Figura 7.1. 

10 

10 

1x1 

10 

10 10 

2x2 

3x3 

10 

40x20 

15 Ohm.cm 

1.054 pF/cm 

Figura 7.4: Layout e perfil do substrato para o circuito de teste com três contactos. 

Os valores das resistências e capacidades apresentadas na figura foram obtidos de duas 

formas distintas, mas com resultados iguais, como seria de esperar. Inicialmente foi usado 

o SMX para produzir as estruturas G, C, IG, IC, bem como o vector das admitâncias ad- 

jacentes Yad j. O primeiro método de obtenção do modelo consistiu em resolver o sistema 

GV¡IG no SMX obtendo-se a parte resistiva do modelo e, no final, multiplicar os valores 

das condutâncias obtidas por α, obtendo-se, desta forma, a parte capacitiva do modelo. 

Quanto ao segundo método, utilizando os valores das estruturas obtidas com o SMX, foi 

resolvido o sistema complexo (7.6) no Matlab [50] e de uma só vez extraídas as partes 

resistiva e capacitiva do modelo. Os valores obtidos, que se confirma serem os mesmos 

em ambos os métodos, apresentam-se na Tabela 7.1. 

Analisando o modelo tridimensional de admitâncias inerente à discretização tridimen- 

0 

1 

10


Contacto 1 Contacto 2 Resistência Capacidade 

1 backplane 23 kΩ 687 aF 

1 2 243 kΩ 65.0 aF 

1 3 1.6 MΩ 9.91 aF 

2 backplane 16.3 kΩ 970 aF 

2 3 113 kΩ 139 aF 

3 backplane 11.4 kΩ 1.38 fF 

Tabela 7.1: Valores das resistências e capacidades do modelo de acoplamento pelo sub- 

strato para a configuração de três contactos. 

sional do substrato, pode avaliar-se o peso da componente capacitiva em relação à com- 

ponente condutiva. Neste caso, tem-se entre dois nós genéricos, i e j, uma condutância 

gi j em paralelo com uma capacitância ci j. Esta componente capacitiva assume um valor 

significativo quando corresponder a uma percentagem significativa da componente con- 

dutiva. Admitindo, por exemplo, 10% como relevante: 

ωci j01gi jωε Si j 

li j01σ Si j 

li jω01 σ 

(7.16) 

Para a tecnologia utilizada neste exemplo, a frequência ω para a qual a componente ca- 

ε 

pacitiva da malha que modela o substrato começa a ser relevante é ω¡633Grads 

de 

f1GHz. 

Usando os valores obtidos na extracção, e tendo em mente o modelo reduzido apre- 

sentado na Figura 7.1, pode calcular-se o valor de frequência a partir do qual os elementos 

capacitivos deste modelo começam a ter relevância face aos elementos resistivos. Neste 

exemplo, utilizando os valores de R10 e C10, verifica-se que: 

ωC1001G10ω633Gradsf1GHz (7.17) 

utilizando como exemplo um factor de 10%. 

Neste caso, a frequência é a mesma para qualquer par RC, dado que a condutividade 

e a permitividade têm a mesma relação em todo o substrato. Este valor de frequência 

condiz com o resultado obtido para os elementos da malha de admitâncias, exactamente 

porque o substrato usado neste exemplo é de camada única.


Os resultados desta secção vêm confirmar a aproximação feita neste e noutros trabal- 

hos quanto à validade dos modelos resistivos, em que se considera que estes são válidos 

para frequências de operação até alguns GHz, dependendo da tecnologia. 

7.3.2 Precisão do Modelo RC 

Como foi visto na secção anterior, torna-se necessário, para frequências superiores a al- 

guns GHz, a utilização de um modelo dinâmico de acoplamento. O modelo proposto 

neste capítulo pretende resolver este problema, sendo no entanto igualmente importante 

verificar a sua precisão e gama de validade. Para obviar esta questão serão analisadas em 

detalhe algumas características essenciais do modelo proposto. 

Escrevendo a equação (7.2) sob a transformada de Laplace, obtém-se: 

¢GsC¤V¡I (7.18) 

que representa as propriedades electromagnéticas da malha tridimensional que modela o 

substrato. 

No caso do problema de acoplamento pelo substrato a entrada é a tensão fixa im- 

posta no único contacto que está “activo” e a saída é a corrente injectada em cada um 

dos outros contactos. No entanto, e como foi explicado anteriormente, dado utilizar-se 

a formulação nodal simples, não é a tensão de excitação que é imposta nos nós do con- 

tacto “activo”, sendo sim injectadas nos nós adjacentes as correntes correspondentes ao 

respectivo equivalente de Norton. Supondo, por exemplo, que se impõe uma tensão sinu- 

soidal de amplitude e frequência fixas, V1, no contacto 1, esta tensão é transformada em 

correntes da seguinte forma: 

I¡Yad j1 V1 

i1 

i2 

. 

iN 

y21 

. 

¡ y11 

yN1 

V1 (7.19) 

em que I é o vector de todas as correntes injectadas nos nós da malha tridimensional, 

cujas únicas entradas não nulas correspondem às correntes injectadas nos nós do contacto 

activo e Yad j1 as admitâncias a eles adjacentes.


Em relação à saída, a corrente num outro contacto 2, por exemplo, I2, esta é obtida 

através do vector das tensões de todos os nós da malha que discretiza o substrato, por: 

I2¡Y T ad j2VI2¡y12 y22 

 

yN2 v1 

v2 

. 

vN 

(7.20) 

Pode então reescrever-se a equação (7.18) de modo a reflectir a relação entre a entrada, 

V1, e a saída, I2, da seguinte forma: 

I2 

V1¡Y T ad j2C¢GsC¤1 Yad j1 

onde Yad j2 representa as admitâncias adjacentes ao contacto 2. 

(7.21) 

Como as admitâncias adjacentes, usadas para efectuar as transformações supra-referidas, 

operam no interior da primeira camada do substrato, dado que é aí que se encontram to- 

dos os contactos, existe uma proporcionalidade constante entre as suas partes real (con- 

dutância) e imaginária (capacitância). Verifica-se então que, sendo α¡σ1 

ε1 , em que ε1 é a 

permitividade da primeira camada e σ1 a sua condutividade, e Cad j¡αGad j: 

Yad j1¡¢1sα¤Gad j1 

Yad j2¡¢1sα¤Gad j2 

Posto isto, pode reescrever-se a função de transferência obtida em (7.21) como: 

I2 

T 

Gad j2 V1¡¢1sα¤2 C¢GsC¤1 Gad j1 

 

Hs 

(7.22) 

(7.23) 

Nesta equação, H¢s¤assemelha-se à matriz de transferência de um sistema linear cujo 

modelo de estados é de obtenção trivial [44]. De [44] sabe-se que os pólos da matriz de 

transferência são dados pelos valores próprios da matrizC1 G no presente caso. 

Verifica-se experimentalmente que o sistema dado por H¢s¤tem N pólos, em que N é o 

número de nós da malha de discretização, e N1 zeros, que anulam todos os pólos menos 

um, pelo que o seu diagrama de Bode de ganho será semelhante ao que se apresenta na 

Figura 7.5.


Ganho [dB] 

190 

180 

170 

160 

150 

140 

130 

10 4 

120 

10 6 

10 8 

10 10 

10 12 

Frequencia [rad/s] 

Figura 7.5: Diagrama de Bode do ganho da função H(s). 

Em relação à componente¢1sα¤2 , ela insere um duplo zero no sistema, sendo a sua 

localização dada por α1 . Como esta componente é relativa ao equivalente de Norton das 

excitações nos contactos, refere-se à primeira camada do substrato, pelo que α1¡ε1 

σ1 . 

Após um conjunto de experiências com diversos perfis e parâmetros tecnológicos, 

chegou-se à conclusão de que a frequência de corte do modelo tridimensional é aproxi- 

madamente dada pela relação ε1 

σ1 

10 14 

relativa à primeira camada. Isto acontece, pois estando 

os contactos (entradas e saídas) do sistema localizados no topo do substrato, é a dinâmica 

da primeira camada que determina efectivamente a dinâmica do sistema do ponto de vista 

dos seus terminais. 

Apresentam-se na Figura 7.6, os diagramas de Bode para o ganho dos modelos tridi- 

mensional e reduzido, para o perfil C da Figura 5.12. 

Os parâmetros do modelo reduzido da Figura 7.1 foram obtidos por resolução de (7.5) 

a uma frequência fixa de ε1 

σ1¢¡9491 10 11 rads¤. 

Como se pode ver pelo diagrama de Bode, o modelo reduzido representa uma boa 

aproximação ao modelo tridimensional. Na gama de frequências apresentada o erro não 

supera os 3 dB. 

Conclui-se que o modelo dinâmico proposto é válido para uma alargada gama de fre- 

quências, oferecendo adicionalmente uma elevada precisão. É de salientar ainda, que para 

10 16 

10 18


Ganho [dB] 

140 

120 

100 

80 

60 

40 

20 

0 

10 0 

−20 

Modelo 3D 

Modelo Reduzido 

10 5 

10 10 

Frequencia [rad/s] 

Figura 7.6: Diagrama de Bode comparativo entre os modelos reduzido e tridimensional. 

frequências ainda mais elevadas, a aproximação quase-estacionária deixaria de ser válida, 

pelo que o método de obtenção do modelo de acoplamento teria que ser reformulado, algo 

que cairia fora do âmbito desta dissertação. 

10 15 

10 20

Capítulo 8 

Conclusões e Trabalho Futuro 

Durante o trabalho subjacente à presente dissertação foi desenvolvida uma ferramenta 

de extracção, o SMX, com a capacidade de obter um modelo resistivo do acoplamento 

através do substrato de um circuito integrado genérico. O modelo obtido foi validado 

através de experiências fisicamente comprováveis e por comparação com modelos obtidos 

por outros extractores. 

Na aproximação utilizada na discretização do substrato do circuito a analisar utilizou- 

-se o método de diferenças finitas (FDM), o que faz com que a ferramenta tenha capaci- 

dade de analisar substratos com quaisquer dimensões e número de camadas sendo por isso 

extremamente versátil. Além disto, é possível especificar a profundidade dos poços, con- 

tactos e guard-rings, ao contrário do que acontece com outras ferramentas de extracção. 

Verificou-se que estas propriedades geométricas do circuito nem sempre são desprezáveis 

e é de esperar que, nesses casos, o SMX apresente uma precisão superior em relação a 

outros extractores. 

Um dos factores mais importantes que influenciam a precisão e o desempenho da fer- 

ramenta é a discretização. É necessário que esta seja correctamente elaborada de forma a 

conduzir a matrizes bem condicionadas (que permitem uma resolução rápida do proble- 

ma) e a soluções com uma boa precisão. 

Face à dimensão elevada dos sistemas a resolver torna-se necessário o recurso a 

métodos iterativos. No problema em análise o algoritmo PCG (Preconditioned Conju- 

gate Gradient) surge como uma solução equilibrada, dada a sua reduzida ocupação de 

memória e um bom tempo de execução. Neste trabalho, verificou-se que a inclusão de 

123

124 CAPÍTULO 8. CONCLUSÕES E TRABALHO FUTURO 

algoritmos baseados em Multigrid (MG, FMG e MGPCG) na ferramenta desenvolvida 

permite a redução significativa do tempo de cálculo do modelo, em comparação com o 

PCG, embora os seus requisitos de memória sejam superiores. 

O modelo obtido é resistivo e verifica-se ser suficientemente preciso para modelar com 

exactidão o acoplamento via substrato em circuitos a operar a frequências até à dezena de 

GHz. Embora a grande maioria dos circuitos actuais funcione ainda a frequências abaixo 

desse valor, assiste-se à proliferação de circuitos de telecomunicações em que esse limite 

de frequência de operação está a ser ultrapassado. Tendo isto em mente, no capítulo 7 

dissertou-se sobre a obtenção de modelos dinâmicos capacitivos, tendo-se inclusive ver- 

ificado que o SMX pode ser directamente usado para extrair modelos RC no caso de 

substratos de camada única. Para outro tipo de substratos, a ferramenta poderia igual- 

mente ser utilizada, mas teria que ser modificada de modo a poder trabalhar com número 

complexos. 

A integração da ferramenta desenvolvida, por exemplo, no ambiente de projecto Ca- 

dence Design Framework II da Cadence Design Systems seria de realização relativamente 

fácil. Seria apenas necessário fazer uma interface de entrada com o formato SIPP [48], 

ao invés do formato CIF usado, e fazer uma interface de saída em sintaxe do simulador 

Spectre. Feito isto, poderia substituir-se a ferramenta Subx [46] da Cadence pelo SMX. 

Em termos de comparação com as ferramentas comerciais existentes no mercado, o 

Space [45] e o Subx, por exemplo, pode concluir-se que o modelo obtido pelo SMX, 

é mais preciso, dado que não assume que o substrato é infinito em termos de área, entre 

outras aproximações, e terá vantagem em ser utilizado em circuitos de modesta dimensão. 

O SMX é uma ferramenta em que se valoriza a precisão da solução obtida, com tempos 

de execução bastante reduzidos face a essa precisão, mas em que, no entanto, a memória 

ocupada pode ser uma limitação. 

Há, portanto, vários campos em que se pode investir no futuro. Sendo a principal 

limitação da ferramenta a memória, é natural enveredar por uma aproximação paralela 

ao problema. Uma solução de computação numa arquitectura tipo cluster, com memória 

distribuída, permite, simultaneamente, a resolução de problemas de maior dimensão e 

a diminuição do tempo de execução do algoritmo. Um dos principais entraves a es- 

ta aproximação de computação paralela é o facto de o problema físico ser dificilmente

dividido em partições, dado que na rede tridimensional de resistências todos os nós de- 

pendem directamente dos nós adjacentes. Existe trabalho já feito nessa área [18, 47] em 

que a abordagem passa por paralelizar os processos de relaxação, cálculo do resíduo e 

transferências inter-grelha, ao invés de dividir o problema em sub-domínios. 

125 

Outra hipótese de investir no futuro será a da obtenção de modelos resistivo-capacitivos, 

tal como foi explicado no capítulo 7. Para tal, basta modificar o código do SMX de modo a 

utilizar as estruturas de dados e funções complexas da biblioteca utilizada (MESCHACH 

[49]). Isto permitiria a extracção de um modelo completo do substrato, permitindo a 

utilização da ferramenta na simulação de circuitos de radio-frequência. 

Uma igualmente interessante possibilidade de trabalho futuro, seria a da integração 

da ferramenta SMX num ambiente de projecto standard, de modo a explorar de forma 

mais completa as suas capacidades. O facto de o SMX não estar integrado num fluxo 

de projecto convencional, torna difícil a validação dos modelos por ele obtidos. Seria 

também conveniente desenvolver protótipos de circuitos de teste de modo a poderem 

fazer-se medidas e verificar a precisão do modelo obtido. Os circuitos de teste poderi- 

am ser simulados, para tal usando os modelos obtidos por vários extractores, incluindo 

o SMX, e os resultados comparados com medições feitas no circuito real. Desta forma, 

poder-se-ia deliberar sobre a exactidão de cada uma das ferramentas utilizadas para extrair 

os modelos. 

Em suma, as avenidas de trabalho futuro são, entre outras: 

Implementação paralela da ferramenta; 

Obtenção de modelos dinâmicos capacitivos; 

Integração da ferramenta num ambiente de projecto convencional; 

Em caso de uma implementação stand-alone: 

– Elaboração de uma interface gráfica para melhor interacção com o utilizador; 

– Adição da possibilidade de visualização tridimensional do substrato, bem co- 

mo do modelo obtido pela ferramenta, de modo a fornecer uma maior sensi- 

bilidade ao projectista;

126 CAPÍTULO 8. CONCLUSÕES E TRABALHO FUTURO 

Desenvolvimento de um circuito de teste para efeitos de verificação do modelo 

obtido pelo SMX e sua comparação com modelos obtidos por outros extractores.

Apêndice A 

Manual do SMX 

A.1 Instalação 

O SMX, Substrate Model Extractor, foi programado em ANSI C, tendo-se utilizado a 

versão 3.0 para a apresentação de resultados nesta dissertação. Este programa corre 

em Linux ou em qualquer tipo de sistema operativo baseado no Unix. Para instalar o 

SMX deve obter-se o pacote com a biblioteca de métodos numéricos e matrizes esparsas 

MESCHACH [49]. 

Após instalação da biblioteca MESCHACH, os seguintes passos devem ser executados 

de modo a instalar o SMX, por exemplo sob o directório /usr/local/src: 

prompt> cp smx-3.0.tar.gz /usr/local/src 

prompt> cd /usr/local/src 

prompt> tar zxvf smx-3.0.tar.gz 

prompt> cd smx-3.0 

prompt> make 

Isto cria um o executável smx no sub-directório smx-3.0. 

A.2 Execução 

Para executar o SMX basta fazer: 

127

128 APÊNDICE A. MANUAL DO SMX 

prompt> smx 

smx: No input file 

syntax: smx [-ge | -mg | -pcg | -gs | -gmres | 

-lsqr | -mgcr | -cg | -pgmres] 

switches: 

-mg: use Multi-Grid V-Cycle iterative method (default) 

-f: use Multi-Grid Full-Cycle iterative method 

-ge: use Gaussian Elimination direct method 

-pcg: use Pre-conditioned Conjugate Gradient iterative method 

-gs: use Gauss-Seidel iterative method 

-gmres: use Generalized Minimum RESidual iterative method 

-lsqr: use Least SQuaRes iterative method 

-mgcr: use Modified Generalized Conjugate Residual iterative 

method 

-cg: use Conjugate Gradient iterative method 

-pgmres: use Pre-conditioned Generalized Minimum RESidual it- 

erative method 

Como se pode observar, o número mínimo de parâmetros é de 1 e trata-se do nome do 

ficheiro em formato CIF (Caltech Interchange Format) que contém a descrição do layout 

a ser analisado. 

Um exemplo de um ficheiro em formato CIF apresenta-se de seguida: 

L diff 

B 2 2 100 100 

L well 

B 4 4 110 100 

O segundo parâmetro, opcional, permite especificar o método a ser utilizado: MG, 

MGPCG, FMG, PCG, GMRES, para mencionar os mais conhecidos. Em caso de omissão 

deste parâmetro será usado o método Multigrid. 

É também necessário dispor, no directório onde se está a executar o SMX, de três

A.2. EXECUÇÃO 129 

ficheiros de tecnologia, nomeadamente: 

3 1 

4 

1 

4 

depths.tec 

layercuts.tec 

substdim.tec 

O primeiro ficheiro tem um conteúdo semelhante ao seguinte: 

Os primeiros dois números especificam o número de linhas e colunas do resto do 

ficheiro, respectivamente. O terceiro número especifica a profundidade dos poços, o quar- 

to a profundidade das difusões e o último número a profundidade dos guard-rings. 

2 2 

Quanto ao ficheiro layercuts.tec, o seu conteúdo é algo como: 

10 100 

100 6.667 

Neste ficheiro definem-se as várias camadas do substrato. Os números na primeira 

linha têm o mesmo significado que no ficheiro anterior. Seguem-se os pares de valor 

de profundidade e condutividade de cada camada. No exemplo apresentado existe uma 

camada (epitaxial) com 10 µm de profundidade e condutividade 100 S/m sobre o corpo 

do substrato que vai desde a profundidade de 10 µm até à profundidade de 100 µm (90 

µm de espessura) e tem uma condutividade de 6.667 S/m. 

O último ficheiro contém somente os limites do substrato em x e y, respectivamente. 

O limite em z é implicitamente definido no ficheiro layercuts.tec. Um exemplo de 

substdim.tec é: 

210 200

130 APÊNDICE A. MANUAL DO SMX 

A.3 Fluxograma do SMX 

Na Figura A.1 apresenta-se o fluxograma de alto nível da ferramenta de extracção desen- 

volvida. 

Ler ficheiros de layout 

e de tecnologia 

Efectuar 

discretização mínima 

Inserir cortes adicionais 

Calcular condutâncias 

entre pontos da grelha 

Formar matriz de 

condutâncias, A 

Aplicar equivalente de 

Norton aos nós dos contactos 

Remover nós dos poços 

Calcular operadores de 

projecção e interpolação 

Figura A.1: Fluxograma do SMX 

Calcular matrizes de 

condutâncias dos níveis 

inferiores 

Calcular vector b 

Calcular factorizações 

necessárias (LU, ICH) 

Para todos os 

nós de k = 1...N 

Colocar nós do 

contacto k a 1V 

Resolver o sistema Ax=b 

Recolher correntes que 

entram nos outros contactos 

Formar coluna k da matriz 

que relaciona os contactos

Apêndice B 

Análise da Complexidade dos Métodos 

Iterativos 

B.1 Método de Jacobi 

A multiplicação da matriz LU de 6 diagonais por xk1consiste em 6N multiplicações 

e 5N adições. A subtracção b¢LU¤xk1consta de N adições. Quanto ao passo 

D1b¢LU¤xk1émais eficiente ter a matriz diagonal D1 previamente calculada, 

pelo que se trata simplesmente do equivalente a uma multiplicação vector-vector, ou seja, 

N multiplicações. Na Tabela B.1 resumem-se estes cálculos. 

Este método necessita de reserva de memória para as estruturas: L, D1 , U, b, x e um 

vector auxiliar, no total de 10N elementos. 

Operação Número de Multiplicações Número de Adições 

5N 

N 

- 

¢LU¤xk1 

D1b¢LU¤xk1 b¢LU¤xk1 6N 

- 

N 

Total 7N 6N 

Tabela B.1: Número de operações para a iteração de Jacobi. 

131

132APÊNDICE B. ANÁLISE DA COMPLEXIDADE DOS MÉTODOS ITERATIVOS 

Operação 

Número de Número de Número de 

Multiplicações Adições Divisões 

Uxk1 

bUxk1 ¢LD¤1bUxk1 

3N 2N - 

- N - 

3N 3N N 

Total 6N 6N N 

Tabela B.2: Número de operações para a iteração de Gauss-Seidel. 

Operação 



3N - 

N - 

4N 

- ¢ωLD¤1 

ωU¢1ω¤Dxk1 

3N 3N N 

Total 7N 7N N 

ωbωU¢1ω¤Dxk1 

ωbωU¢1ω¤Dxk1 

Tabela B.3: Número de operações para a iteração do método SOR. 

B.2 Método de Gauss-Seidel 

No método de Gauss-Seidel multiplica-se a parte estritamente superior de A por x, pelo 

que se têm 3N multiplicações e 2N adições. O passo de subtracção consta novamente do 

equivalente a N adições e no passo de substituição descendente,¢LD¤1bUxk1, 

têm-se 3N multiplicações, 3N adições e N divisões. Estes resultados estão sumariados na 

Tabela B.2. 

Para o método de Gauss-Seidel há que reservar memória para as estruturas: L, D, U, 

b, x e um vector auxiliar, no total de 10N elementos. 

B.3 Método de Sobre-Relaxação Sucessiva, SOR 

Neste método assume-se que o peso ω é constante. Como tal, tem-se multiplicação¢D 

a 

U¤xk1que consiste em 4N multiplicações e 3N adições. A subtração de vectores conta 

com N adições e a substituição descendente, como foi visto, consta de 3N multiplicações, 

3N adições e N divisões. Na Tabela B.3 apresentam-se estes resultados.

B.4. MÉTODO GMRES 133 

No caso do SOR os requisitos de memória são as estruturas: ωL,¢1ω¤D, D, ωU, 

ωb, x e um vector auxiliar, no total de 11N elementos. 

B.4 Método GMRES 

O número de operações aritméticas para cada cálculo do algoritmo GMRES está sumari- 

ado na Tabela B.4. No GMRES existem dois ciclos: um, externo, que é repetido 1£2££m vezes e outro, interno, que é executado i¡1£2££j vezes. No total, o ciclo 

interno é executado 

j¡ 

mm1vezes, 

tendo-se portanto os seguintes números de operações: 

2 

Multiplicações: m ¢NN¤m 2 ¢7NN¤mm1 

Adições: m 2 6N¢N1¤mm1 

Divisões: m N 

2N ¢N1¤Nm 2N Minimização Final: m3 

2 (método Least Squares, O¢N 3¤, aplicado à matriz de Hes- 

senberg) 

O número de operações do método GMRES é dominado pelo número de operações 

de multiplicação, tendo o método uma complexidade de O¢m 2 N¤, em que m é o número 

de iterações. 

Em relação à complexidade de memória, o método comporta as seguintes estruturas: 

A, b, x, r, e, Vm, w, ym e H. A matriz Vm vai contendo os vectores v ao longo das iterações 

do algoritmo. Quanto à matriz de Hessenberg, ela vai crescendo conforme o número de 

iterações, tendo¢m1¤ m elementos. Tem-se, portanto, que este algoritmo ocupa cerca 

de 13NmNm1m 

2 

mN elementos, sendo m o número de iterações do algoritmo. 

B.5 Método do Gradiente Conjugado, CG 

No CG há três produtos internos (3N multiplicações e 3¢N1¤adições, três multiplicações 

escalar-vector (3N multiplicações), três ajustes de vector (3N adições) e, sendo o cálculo 

mais dispendioso, a multiplicação Ap (7N multiplicações e 6N adições). O resumo destes 

valores encontra-se na Tabela B.5.



Operação Multiplicações Adições Divisões 

Av j 7N 6N - 

¦w N j£vi§ 

N1 - 

j¥ w jhi jvi N N - 

¥w N N1 - 

w jh j1j - - N 

Tabela B.4: Número de operações para a iteração do método GMRES. 

Operação Número de Multiplicações Número de Adições 

¦r j£r N j§ 

N1 

Ap 7N 6N 

¦Ap j£p N j§ 

N1 

α j p j N - 

x j1¡x jα j p j - N 

α jAp j N - 

j1§ r j1¡r jα jAp j - N 

¦r j1£r N N1 

β j p j N - 

p j1¡r j1β j p j - N 

Total 13N 12N 

Tabela B.5: Número de operações para a iteração do método CG.

B.6. MÉTODO DO GRADIENTE CONJUGADO PRÉ-CONDICIONADO, PCG 135 

Os requisitos de memória do CG são: A, x, b, r, p e Ap, que correspondem a 12N 


B.6 Método do Gradiente Conjugado Pré-condicionado, 

PCG 

Em relação ao CG, este método acrescenta apenas um passo: a resolução do sistema 

Mz j1¡r j1. Como na implementação utilizada a matriz M corresponde à factorização 

incompleta de Cholesky: 

M¡LL T 

(B.1) 

em que L é uma matriz triangular inferior. O referido sistema pode escrever-se então sob 

a forma: 

ou seja, resolve-se em primeiro lugar: 

e posteriormente: 

LL T z j1¡r j1 

Lu¡r j1 

(B.2) 

(B.3) 

L T z j1¡u (B.4) 

A resolução do primeiro sistema corresponde a substituição descendente, pelo que 

comporta 3N multiplicações, 3N adições e N divisões. Quanto ao segundo sistema, o 

número de operações é igual, tratando-se, no entanto, de uma substituição ascendente. 

Em resumo, o número de operações aritméticas gastas no PCG está patente na Tabela 

B.6. 

Os requisitos de memória do PCG são semelhantes aos do CG com a adição da matriz 

de pré-condicionamento, LL T , o que corresponde a 127¡19N elementos.


Operação 



Passos em comum com o CG 13N 12N - 

Mz j1¡r j1 6N 6N 2N 

Total 19N 18N 2N 

Tabela B.6: Número de operações para a iteração do método PCG.

Bibliografia 

[1] B. M. J. Kup, E. C. Dijkmans, P. J. A. Naus e J. Sneep, ”A bit stream digital-to- 

analog converter with 18-b resolution”, IEEE J. Solid State Circuits, vol. 26, n o 12, 

págs. 1757-1763, Dezembro de 1991. 

[2] François J. R. Clement, Eytan Zysman, Mather Kayal e Michel Declercq, ”Layin: 

Toward a Global Solution for Parasitic Coupling Modeling and Visualization”, IEEE 

Custom Integrated Circuits Conference, 1994. 

[3] Adil Koukab, Catherine Dehollain e Michel Declercq, ”HSpeedEx: A High-Speed 

Extractor for Substrate Noise Analysis in Complex Mixed-Signal SOC”, IEEE De- 

sign Automation Conference, 2002. 

[4] João Paulo Costa, ”Técnicas Eficientes para Análise e Modelação de Efeitos de 

Acoplamento Via Substrato em Circuitos Integrados Mistos”, dissertação para 

obtenção do grau de Mestre em Engenharia Electrotécnica e de Computadores, Uni- 

versidade Técnica de Lisboa, 1998. 

[5] João Paulo Costa, Mike Chou e L. Miguel Silveira, ”Efficient Techniques for Accu- 

rate Extraction and Modeling of Substrate Coupling in Mixed-Signal IC’s”, Design 

Automation and Test in Europe, 1999. 

[6] João Paulo Costa, Mike Chou e L. Miguel Silveira, ”Efficient Techniques for Accu- 

rate Modeling and Simulation of Mixed Signal IC’s”, IEEE Transactions on CAD, 

1999. 

[7] João Paulo Costa, Mike Chou e L. Miguel Silveira, ”Precorrected-DCT Techniques 

for Modeling and Simulation of Substrate Coupling in Mixed-Signal IC’s”. 

137

138 BIBLIOGRAFIA 

[8] Mike Chou, Jacob White, ”Multilevel Integral Equation Methods for the Extrac- 

tion of Substrate Coupling Parameters in Mixed-Signal IC’s”, Design Automation 

Conference, 1998. 

[9] Mike Chuan Chou, ”Fast Algorithms for Ill-Conditioned Dense-Matrix Problems in 

VLSI Interconnect and Substrate Modeling”, dissertação para obtenção do grau de 

Doutor em Electrical Engineering and Computer Science, Massachusetts Institute 

of Technology, 1998. 

[10] Joe Kanapka, Joel Phillips, Jacob White, ”Fast Methods for Extraction and Sparsifi- 

cation of Substrate Coupling”, Design Automation Conference, 2000. 

[11] T. Smedes, N. P. van der Meijs e A. J. van Genderen, ”Extraction of Circuit for 

Substrate Cross-talk”, IEEE International Conference on Computer-Aided Design, 

1995. 

[12] A. J. van Genderen, N. P. van der Meijs e T. Smedes, ”Fast Computation of Substrate 

Resistances in Large Circuits”, in Proc. European Design and Test Conference, págs. 

560-565, 1996. 

[13] E. Schrik e N. P. van der Meijs, ”Combined BEM/FEM Substrate Resistance Mod- 

eling”, Design Automation Conference, 2002. 

[14] Nishath K. Verghese e David J. Allstot, ”Subtract: A Program for the Efficient Eval- 

uation of Substrate Parasitics in Integrated Circuits”, IEEE International Conference 

in Computer-Aided Design, 1995. 

[15] Balsha R. Stanisic, Nishath K. Verghese, Rob. A. Rutenbar, L. Richard Carley e 

David J. Allstot, ”Addressing Substrate Coupling in Mixed-Mode IC’s: Simulation 

and Power Distribution Synthesis”, IEEE Journal of Solid-State Circuits, 1994. 

[16] Achi Brandt, “Guide to Multigrid Development”, in Multigrid Methods, editado por 

W. Hackbusch e U. Trottenberg, 1982. 

[17] William L. Briggs, Van Emden Henson e Steve F. McCormick, ”A Multigrid Tuto- 

rial”, 2 a edição, Society for Industrial and Applied Mathematics, 2000.

BIBLIOGRAFIA 139 

[18] Ulrich Trottenberg, Cornelis Oosterlee e Anton Schüller, ”Multigrid”, Academic 

Press, 2001. 

[19] David K. Su, Marc J. Loinaz, Shoichi Masui e Bruce A. Wooley, ”Experimental 

Results and Modeling Techniques for Substrate Noise in Mixed-Signal Integrated 

Circuits”, IEEE Journal of Solid-State Circuits, vol. 28, n o 4, Abril de 1993. 

[20] T. A. Johnson, R. W. Knepper, V. Marcellu e W. Wang, ”Chip Substrate Resis- 

tance Modeling Technique for Integrated Circuit Design”, IEEE Transactions on 

Computer-Aided Design of Integrated Circuits”, 1984. 

[21] Sujoy Mitra, R. A. Rutenbar, L. R. Carley e D. J. Allstot, ”A Methodology for 

Rapid Estimation of Substrate-Coupled Switching Noise”, IEEE Custom Integrated 

Circuits Conference, 1995. 

[22] Joel R. Phillips e L. Miguel Silveira, ”Simulation Approaches for Strongly Intercon- 

nect Systems”. 

[23] M.R. Pinto, PISCES IIB, Stanford University, 1985. 

[24] Ranjit Gharpurey e Robert G. Meyer, ”Modeling and Analysis of Substrate Coupling 

in Integrated Circuits”, IEEE International Conference in Computer-Aided Design, 

1996. 

[25] Nishath K. Verghese, ”Extraction and Simulation Techniques for Substrate-Coupled 

Noise in Mixed-Signal Integrated Circuits”, dissertação para obtenção do grau de 

Doutor em Electrical and Computer Engineering, Carnegie Mellon University, 

1995. 

[26] Kuntal Joardar, ”A Simple Approach to Modeling Cross-Talk in Integrated Cir- 

cuits”, 1994. 

[27] J. C. Tipper, ”A straightforward Iterative Algorithm for the Planar Voronoi Dia- 

gram”, Information Processing Letters 34, Elsevier, págs. 155-160, 1990. 

[28] Ivan L. Wemple e Andrew T. Yang, ”Integrated Circuit Substrate Coupling Models 

Based on Voronoi Tesselation”, IEEE Transactions on Computer-Aided Design of 

Integrated Circuits and Systems, 1995.

140 BIBLIOGRAFIA 

[29] Edoardo Charbon, Luís Miguel Silveira e Paolo Miliozzi, ”A Benchmark Suite for 

Substrate Analysis”. 

[30] Edoardo Charbon, Ranjit Gharpurey, Robert G. Meyer, Sangiovanni Vincentelli, 

”Semianalytical Techniques for Substrate Characterization in the Design of Mixed- 

Signal ICs”, International Conference on Computer Aided Design, págs. 455-462, 

Novembro de 1996. 

[31] L. Miguel Silveira e Nuno Vargas, ”Multilevel Finite Difference Methods for the 

Characterization of Substrate Coupling in Deep Sub-Micron Designs”, IEEE Design 

and Test of Computers. 

[32] J. Pedro Amaro, Joel R. Phillips e L. Miguel Silveira, ”A Framework for Analysis 

of Substrate Coupling Models for Mixed-Signal Circuits”, Design Automation and 

Test in Europe, 2002. 

[33] Thomas Brandtner e Robert Weigel, ”Hierarchical Simulation of Substrate Coupling 

in Mixed-Signal ICs Considering the Power Supply Network”. 

[34] Michel P. J. Carpentier, ”Análise Numérica – Teoria”, Departamento de Matemática 

do Instituto Superior Técnico, 1993. 

[35] Luís T. Magalhães, ”Álgebra Linear Como Introdução à Matemática Aplicada”, Tex- 

to Editora, 1993. 

[36] Richard Barrett, Michael Berry, Tony Chan, James Demmel, June Donato, Jack 

Dongarra et al., ”Templates for the Solution of Linear Systems: Building Blocks for 

Iterative Methods”. 

[37] Yousef Saad, ”Iterative Methods for Sparse Linear Systems”, PWS Publishing Com- 

pany, 1996. 

[38] Lloyd N. Trefethen e David Bau III, ”Numerical Linear Algebra”, Society for In- 

dustrial and Applied Mathematics, 1997. 

[39] William H. Press, Saul A. Teukolsky, Willian T. Vetterling e Brian P Flannery, ”Nu- 

merical Recipies in C: the Art of Scientific Computing”, 2 a edição, Cambridge Uni- 

versity Press, 1992.

BIBLIOGRAFIA 141 

[40] Golub and Van Loan, “Matrix Computations”, Johns Hopkins University Press, 

1993. 

[41] Youcef Saad e Martin H. Schultz, ”GMRES: A Generalized Minimal Residual Al- 

gorithm for Solving Nonsymmetric Linear Systems”, SIAM J. Sci. Stat. Comput., 

1986. 

[42] John David Jackson, ”Classical Electrodynamics”, John Wiley & Sons, 2 a edição. 

[43] Edward M. Purcell, ”Electricity and Magnetism – Berkeley Physics Course – vol- 

ume 2”, McGraw-Hill, 1965. 

[44] Eduardo J. R. Morgado, “Controlo”, Secção de Folhas do Instituto Superior Técnico, 

1997 

[45] Nick van der Meijs et al., ”VLSI Physical Design Modeling and Verification”, The 

SPACE Project, http://cas.et.tudelft.nl/˜space. 

[46] Cadence Design Systems, http://www.cadence.com/datasheets/dat pdf/sca446apn.pdf 

[47] MGNet, http://www.mgnet.org 

[48] Silicon Integration Initiative, Inc., “Standard Interconnect Performance Parameters”, 

http://www.si2.org 

[49] MESCHACH, http://www.netlib.org/c/meschach/ 

[50] The MathWorks, “Matlab”, http://www.mathworks.com/

Modelaç ˜ao do Acoplamento Via Substrato em Circuitos ... - INESC-ID

Create successful ePaper yourself

Delete template?

Save as template?