Logikfamilien (4.2 MB)

VLSI Design: Logikfamilien 

Logikfamilien 

P. Fischer, ZITI, Uni Heidelberg, Seite 1

� CMOS 

� Buffer 

� Pass Gate Logik 

� P-Last / Pseudo-NMOS 

� DCVS 

� Differentielle Logik CML 

� Dynamische Logik 

� ECL, TTL 


Übersicht 


CMOS 



CMOS = Complementary MOS 

� Die Einsen am Ausgang werden durch ein 'pullup' Netzwerk von Transistoren erzeugt, die Nullen durch 

ein 'pulldown' Netzwerk. 

� Pullup und Pulldown sind DUALE Netzwerke, sie enthalten je N PMOS / NMOS Transistoren. 

� Ein CMOS Gatter mit N Eingängen hat 2N Transistoren 

� CMOS ist sehr robust und daher die meistbenutzte Logikfamilie 

I 1 

I I2 I N 

I 1 

I 2 

I N 

PMOS 

Pullup 

Netz 

NMOS 

Pulldown 

Netz 


VDD 

GND 

Q 

Vorteile von CMOS: 

� volle Pegel (unabhängig von Versorgungsspannung, 

Parametervariationen und Transistorgrößen) 

�� daher i.d.R. hoher Störabstand 

� kein DC Stromverbrauch 

� Robust (Gatter funktionieren (logisch) immer, egal, wie 

die Transistoren dimensioniert sind) 

� Migration zu neuen Technologien einfach 

Nachteile: 

� nicht die schnellste Logikfamilie 

� für einige Schaltungen ungünstig (z.B. MUX) 

� Layouts oft nicht sehr kompakt 

� hohe Strom-Transienten während des Schaltens (Querstrom!) 


V GS 

VDD 

S 

D 

Warum PMOS für pullup ? 

� PMOS als Pullup ist ok: � NMOS als Pullup geht nicht: 

V DD 

0 

VGS ist unabhängig von der Ausgangsspannung 

⇒ der PMOS bleibt abgeschaltet 

� Entsprechend ist ein PMOS als Pulldown ungeeignet. 


VDD 

V GS 

VDD 

D 

S 

NMOS: 

Schlechte '1' 

V DD 

V DD-V TN 

V GS sinkt mit steigender Ausgangsspannung 

⇒ der NMOS schaltet ab ! 

Die Ausgangsspannung steigt nur bis V DD-V TN. 

Durch Substrateffekt sogar noch weniger ! 

P. Fischer, ZITI, Uni Heidelberg, Seite 5 

0

Konstruktion des pulldown - Teils 

� Serielle NMOS implementieren die NAND Funktion 

�� Parallele NMOS implementieren die NOR Funktion 

A 

B 

A B 

A • B 

A + B 

� Damit lassen sich alle Funktionen der Form Y = NOT (a + ab + cde + ...) darstellen 



� Schaltbild zur Simulation der nachfolgenden Seiten: 


PARAMETERS: 

Voff = 1 

{Voff} 

in 

V1 

Der CMOS Inverter 

MP 

MN 

0 

I 

I 

Vout 

3V 

V2 

3V 


CMOS Inverter Transferkennlinie 

� Entstehung der Transferkennlinie: 

- Für jede Eingangsspannung werden die Ausgangskennlinien des NMOS und des PMOS gezeichnet. 

- Der Ausgang nimmt die Spannung am Schnittpunkt an (I D,N = I D,P). 

� Simulation mit VDD=3V, (W/L) N = (W/L) P = 0.8µm/0.25µm, V in = 0..3V in Schritten von 0.5V 

V in = 0.0V 

V in = 0.5V 

V in = 1.0V 

V in = 1.5V 

V in = 2.0V 

V in = 2.5V 3.0V 


V in = 3.0V 

V in = 2.5V 

V in = 2.0V 

V in = 1.5V 

V in = 1.0V 

V in = 0.0V 0.5V 


CMOS Inverter Transferkennlinie 

� Details in der Schaltregion: Eingang 1.0V...2.0V in Schritten von 0.2 V 

1.8V 

2.0V 

1.6V 


1.4V 

Schwelle 

~ 1.3V 

1.2V 

1.0V 



Test: Transfer Charakteristik (DC sweep) 

W P = 0.8µm, 

Schwelle 

~ 1.3V wie 

vorher W P = 1.6µm 

W P = 2.4µm 

W N = 0.8µm 


� Für den NMOS ist V GS = V in, V DS = V out. 

Bereiche in der Transferkennlinie 

� Daher muß in Sättigung V out > V in – V TN sein. 

VDD 

V out 

NMOS off 

V TN 

V in 


NMOS sat. 

NMOS lin. 

V out 

VDD 

V in 

� Für den PMOS ist V GS = VDD-V in, V DS = VDD-V out. 

� Das NMOS Diagramm ist daher um 180 0 gedreht. 

VDD 

V out 

V in 

PMOS lin. 

PMOS sat. 

S 

V out 

PMOS off 

VDD-|V TP| VDD 

V in 


Bereiche in der Transferkennlinie 

NMOS off 

PMOS lin 

V IL 

� Die Schwellen sind etwa da, wo Steigungen = -1 sind. 

NMOS sat 

PMOS lin 

NMOS sat 

PMOS sat 

NMOS lin 

PMOS sat 

NMOS lin 

PMOS off 

� Beachte: Dies gilt für einen 'statischen' DC-Sweep. Beim dynamischen Schalten sind die Transistoren 

schneller im linearen Bereich, weil die Gatespannung dann VDD bzw. 0 ist. 


V T 

V IH 


Transientenanalyse 

� Simulation eines Inverters (Modelle 'nmos_simple' und 'pmos_simple' mit V T je 1V) mit 100fF Last. 

� V dsat = V GS – V T = 3V – 1V = 2V 

NMOS kommt etwa hier in 

den linearen Bereich. Die 

Entladung ist daher nicht 

mehr linear, sondern eher 

exponentiell (RC) 



Berechnung der Schwelle 

� Unter Vernachlässigung des Ausgangswiderstands kann man die Schwellenspannung V M abschätzen: 

Es muß gelten: I NMOS 

= I PMOS 

K N (W/L) N (V M-V TN) 2 = K P (W/L) P (VDD-V M-|V TP|) 2 (beide MOS in Sättigung!) 

r( 

VDD − VTP 

) + VTN 

βP 

VM = mit r = βN 

1 + r 

�� Für V VTN = |V |VTP| | wird die Forderung V VM= = VDD/2 durch r=1 erfüllt, d.h. 

K N (W/L) N = K P (W/L) P 

mit 

� Da normalerweise K N = 2...3 K P folgt für eine Schwelle auf halber Versorgung: 

(W/L) P = 2...3 x (W/L) N 

� In DSM hängt der Drainstrom nicht mehr quadratisch, sondern fast linear von der Gatespannung ab. 

Am Ergebnis ändert das nichts! 


β 

= 

K 

W 

L 


Sensitivität der Schwelle 

� Trägt man die (vereinfachende) Formel auf, so findet man (VDD=3.0V, V TN=|V TP| =0.5V) 

Schwelle [V] 

3,0 

2,5 

2,0 

1,5 

1,0 

0,5 

0,0 

0 1 2 3 4 5 

β /β 

p n 

� Die Schwelle hängt recht unkritisch von k ab. 

� Wichtigeres Kriterium für k sind Anstiegs- und Abfallzeiten. 



Verzögerung = Durchlaufzeit 

� Durch den verlangsamten Signalanstieg am Ausgang schalten nachfolgende Stufen etwas verzögert: 

idealer 

buffer 

T PHL 

� Merke: - Durch Lastkapazitäten kommt es bei jedem Gatter zu Verzögerungen 

- Die Verzögerung steigt mit steigender kapazitiver Belastung des Ausgangs ('Fan-Out') 

- Fallende (T PHL) und steigende (T PLH) Flanke haben i.a. NICHT gleiche Verzögerung 

(sie werden durch unterschiedliche Transistoren gemacht!) 

- Die Verzögerungen und deren Lastabhängigkeiten müssen bei der Simulation genau 

berücksichtigt werden, denn sie limitieren letztlich die Geschwindigkeit einer Schaltung 


T PLH 

'PLH': Propagation Low-High 


� Hiermit ist meist Durchlaufzeit gemeint. 

Geschwindigkeit 

� Durchlaufzeit (t PLH, t PHL) entsteht durch die endliche Anstiegszeit des Ausgangssignals. 

� Wird durch eine Last die Anstiegszeit langsamer, so wird effektiv die Durchlaufzeit länger. 

Geschwindigkeit wird bestimmt durch: 

� Die Kapazität, die umgeladen werden muß. Die wichtigsten sind 

- Drain-Gate Überlapp (Drain-Bulk und Drain-Gate sind klein, da MOS meist in Sättigung oder aus) 

- Drain-Dioden Sperrschichtkapazitäten 

- Leitungskapazitäten 

- Eingangskapazität der nächsten Stufe (Gate-Kapazitäten) 

�� Die Transistorparameter: K, die Schwelle und das W/L der Transistoren 

� Die Versorgungsspannung (Höhere Versorgung ⇒ mehr Strom, aber auch höherer Hub) 

� Die Anstiegszeit des Eingangssignals 

Faustregel: 

� Wenn die Lastkapazitäten dominieren (Leitungen und C in der nächsten Stufen, also z.B. bei hohem 

Fan-Out) braucht man große Transistoren ('Treiber', 'buffer') 

� Ist die Last klein, so genügen kleine Transistoren 

Merke: Minimale Gate Verzögerung für 0.25µm-0.35µm Technologien ist etwa 50-100 ps 



Geschwindigkeit 

� Näherungsweise Berechnung: 

- Lastkapazität wird konstant angenommen (Real: Diodenkapazitäten sind spannungsabhängig) 

- Als Entladestrom wird der Sättigungsstrom genommen (Real: Strom nimmt ab, wenn MOS aus Sättigung kommt) 

- Quadratisches Modell wird angenommen (nicht mehr gültig in DSM. Transistoren liefern dort weniger Strom) 

- Ausgangswiderstand wird vernachlässigt (das ist hier ein kleiner Fehler) 

� I = (K/2)(W/L) (VDD-V TN) 2 

� Linearer Abfall: ∆U / ∆t = I / C L. 

� ∆U = VDD /2 

� t pHL = C L x ∆U / I = 

C L VDD 

K (W/L) (VDD-VTN) 2 

K (W/L) (VDD-VTN) � Für V TN « VDD, also VDD-V TN ~ VDD: 

� t pHL ~ 

C L 

K (W/L) VDD 

� Und entsprechend für die Anstiegszeit (mit dem PMOS) 

� Für gleiche Anstiegs- und Abfallzeiten muß k N = k P sein 

� Die Erhöhung von K (via W bei minimalem L) erhöht auch die Diffusions- und Überlappkapazität. C/K wird 

dann konstant. Das setzt ein unteres Limit für die Verzögerung 

V OUT 

� Erhöhung der Versorgungsspannung hilft, kostet aber viel Leistung (s.u.) 


t pHL 


t

� PSPICE mit nmos25, pmos25. 

� Externe Last von C L = 100fF ... 400 fF 

Transientensimulation 

� Man erkennt den linearen Anstieg der Verzögerung mit der Lastkapazität 



Delay vs. VDD für DSM und 'grobe' Technologie 

� Vergleich MOS_simple / MOS_025 

für verschiedene 

Versorgungs-Spannungen 

� In DSM steigt der Drainstrom 

NICHT mehr quadratisch mit der 

Gatespannung (velocity 

saturation, mobility degradation) 

� Die Verbesserung in der 

Durchlaufzeit sollte daher 

geringer sein 

� Dies sieht man auch in der 

abgebildeten Simulation mit 

PSPICE 


NMOS _simple 

(quadrat. Gesetz, 

Schwelle = 1V) NMOS25 

(Schwelle ~ 0.5V) 


� Aus Rabey, 1.2µm Technologie, 5V Versorgung: 

PMOS 

PMOS 

PMOS 

Abschätzung der Kapazitäten 

� Der Miller-Effekt ist hier vernachlässigt (s. nächste Seite) 

Überlapp 

Dioden 

Gates 

C[fF] 

1.6 

4.7 

3.5 

5.9 

3.8 

11.4 

� Diese grobe Analyse zeigt: 

- Kapazitäten des Treibers und des angeschlossenen Inverters sind vergleichbar 

- Der PMOS trägt viel zur Kapazität bei ⇒ ein kleinerer PMOS gibt eine kleinere mittlere Verzögerung (Mittelwert aus t PHL 

und t PLH). Man nimmt daher u.U. die leichte Reduktion im Störabstand und die Asymmetrie in t r und t f in Kauf 

- Bei kurzen Leitungen tragen diese wenig bei. 

� In DSM werden die MOS-Kapazitäten kleiner, die der Leitungen sinken relativ wenig ⇒ Die korrekte 

Abschätzung (Extraktion) der Leitungskapazitäten wird wichtiger! 


Leitung 

2 

32.7 


Miller Effekt 

� Eine Kapazität zwischen Ausgang und Eingang (C GD) trägt doppelt bei, da die beiden Kondensatorplatten 

ihre Potentiale in die entgegengesetzte Richtung ändern. 

� Dem Gate muß man die Ladung 2 x VDD x C GD zuführen 

� In der folgenden Simulation sieht man, was während des Übergangs passiert (ein Serienwiderstand 

reduziert die Impedanz der Signalquelle, um den Effekt besser sichtbar zu machen): 

� Der Miller-Effekt muß besonders bei 

analogen Schaltungen beachtet werden. 

V1 = 0 

V2 = 5 

TD = 0 

TR = 100p 

TF = 100p 

PW = 4n 

PER = 20n 

PARAMETERS: 

Cload = 100f 

vin 

V1 

R1 

10k 

V 

C1 {Cload} 

vgate 


M2 

V 

M1 

0 

Simple 

out 

V 

Simple 

V2 

5V 

Gates 


Einfluß der Anstiegszeit des Eingangssignals 

� Die Abschätzung und Simulationen wurden mit 'schnellen' Eingangssignalen gemacht. 

� Die MOS schalten dadurch sofort (bei t=0) ganz durch. In Wirklichkeit ist das Eingangssignal etwa so 

langsam wie das Ausgangssignal. Das führt zu einer weiteren Verzögerung. 

� Bei der genauen Charakterisierung von Zellen muß also ein realistisches Eingangssignal benutzt werden. 

Das ist z.B. in Verilog schwer zu modellieren!! 

� In guter Näherung findet man: 


t p,real 

t p,Stufe 

2 

tp , real = t p, 

Stufe + ( tr 

/ 2) 

2 

t r 


Leistungsverbrauch (1) 

� Ist bei Hochleistungs-ICs eines der dominierenden Probleme 

� Setzt sich aus mehreren Anteilen zusammen: 

1. Dynamischer Anteil zum Auf- und Entladen von Last- und parasitären Kapazitäten 

Die Ladung auf der Lastkapazität C List Q = VDD x C L. Mittlerer Strom bei Frequenz f: I = f x Q. 

Die mittlere Leistung ist daher 

P = I x VDD = f x VDD 2 x C l 

Während des Ladens wird ½ x C x VDD 2 im PMOS dissipiert, beim Entladen der Rest im NMOS. 

Dieser Anteil hängt nicht von den Transistoreigenschaften ab. 

⇒ Lastkapazität reduzieren 

⇒ Versorgungsspannung reduzieren 

⇒ Betriebsfrequenz reduzieren 


Leistung 

[W] 

Angabe im Datenblatt 

z.B. in µW / MHz 

VDD = 3V 

VDD = 2V 

Frequenz 

[Hz] 


Leistungsverbrauch (2) 

2. Dynamischer Kurzschlußstrom zwischen VDD und Masse während des Schaltens 

Man findet (mit β = β N= β P und V T = V TN = V TP) 

P = (β/12)(VDD-2V T) 3 (τ/T) 

mit τ = Anstiegszeit, T = Periode 

⇒ Anstiegszeiten der Signale müssen kurz sein. (Selbst für Signale mit niedriger Frequenz!) 

2. Leckströme der Drain- und Sourcedioden. Hängt von deren Größe ab. P = VDD x I leak 

3. Leckstrom durch den Kanal (Subthreshold-Leakage, besonders bei niedrigen V T in DSM Prozessen) 

� Der Leistungsverbrauch eines Chips kann auch durch das Schaltungsdesign reduziert werden: 

- Weniger, optimierte Logik 

- Anzahl der Flanken (Pegelwechsel) reduzieren (Gray Code Zähler statt Binärzähler etc.) 

- Unbenutzte Teile abschalten 

- Parallelisieren, ... 



� β= K x W/L muß maximiert werden, daher L = L min 

Wahl der Transistorgrößen 

� Für die Wahl des Verhältnisses von β p/β n gibt es verschiedene Kriterien: 

- Maximaler Störabstand, also V T = VDD/2 ⇒ β p = β n 

- gleiche Anstiegs- und Abfallzeiten ⇒ β p = β n 

- Minimale mittlere Verzögerung ⇒ β p < β n (Kapazität durch PMOS kleiner halten!) 

� Zusammen mit den Technologiekonstanten K N und K P legt man so W P/W N fest 

� Der Absolutwert von W N hängt von der zu treibenden Last ab. 

Je größer die Last, desto größer sollten die Ws sein. 

Damit steigt aber auch die Eingangskapazität. 

� Bei sehr großen Lasten sollte man daher lieber 'minimale' Inverter/Gatter benutzen und Buffer einfügen 

(s. später) 



A 

B 

CMOS NAND / NOR 

NAND2 A B F 

NOR2 

0 0 1 

F 

A B 

A 

B 


0 1 1 

1 0 1 

1 1 0 

A • B 

A 

B 

B 

A 

F 

A B 

A B F 

0 0 1 

0 1 0 

1 0 0 

1 1 0 

A + B 



Layouts von NAND und NOR 

Bei diesem speziellen Layout wurden 

'ringförmige' Transistoren benutzt (um 

Leckströme bei Bestrahlung der Chips zu 

vermeiden) 

In diesem Fall ist das NOR2 Gatter 

wesentlich kleiner als das NAND2 Gatter ! 


a 

b 

c 

a b c 

a 

b 

f 

komplexere Gatter 

a • b • c 

� Merke: Mehr als ~ 5 Eingänge sind ungebräuchlich (zu viele MOS in Serie) 


c 

NAND3 

b 

c 

a 

b f 

c 

a 

a 

b c 

'OR2NAND1' = ON21 (in AMS) 


f

Weitere gemischte Gatter 

� Entsprechend kann man in CMOS direkt implementieren: 

etc. 

� Diese direkt implementierten Gatter benötigen bei N Eingängen 2N Transistoren (N x NMOS, N x PMOS) 



Stick Diagramm 

� Um die Topologie eines Layouts dazustellen zeichnet man 'Stick-Diagramme' mit vereinfachten FETs: 

� Was ist z.B. das hier ? 


VDD 

GND 

Gates 

in1 in2 

out 

GND 

PMOS-Bereich 

NMOS-Bereich 


NOR2 

NAND2 


Gatter Schaltung und Layout 

Drain gemeinsam 

genutzt 

Kontakt nicht nötig ⇒ Gates können 

zusammengeschoben werden 


a 

b 

c 

Zwei unterschiedliche Stick Layouts 

a b 

c 

a 


b f 

c 

f 

a b c 

a c b 

Diffusion hat 

Unterbrechung 


f 

f

Wie findet man eine 'gute' Transistorreihenfolge ? 

� Eine 'gute' Transistorreihenfolge ergibt eine ununterbrochene Diffusion (kompaktes Layout) 

� Man sucht dazu eine Transistorreihenfolge, so daß die (Euler-) Pfade durch die NMOS und PMOS alle 

MOS erreichen. 

� Versorgungsspannung und Masse bilden jeweils einen Knoten 

� Gibt es 'kritische' Knoten, an denen eine ungerade Anzahl Netze zusammenläuft, muß man dort 

anfangen/ aufhören 

� Bei mehr als 2 Knoten mit ungerader Anzahl von Netzen gibt es keine Lösung. Die Diffusion muß dann 

unterbrochen werden. 

� Bei mehreren Lösungen wählt man z.B. so aus, daß Signale 'innen' liegen, Versorgungen 'außen' 


kritische Knoten 


a 

b 

a 

c 

c 

a 


b 

kritische 

Knoten 

b f 

c 

f 

Beispiel 1 

f 

c b a 


d 

a 

b 

a 


e 

Y = a(d+e)+bc 

d 

e 

c 

f 

b 

c 

c⇒b⇒a⇒d⇒e 

Beispiel 2 

e d a b c 


f

Transistorgrößen in MOS Gattern 

� Betrachte z.B. NOR Funktion mit 3 Eingängen: 

� Die Serienschaltung der PMOS hat bei 3 identischen W/L 

die effektive Größe W/L Σ = 1/3 W/L. 

� Die Anstiegszeit wird daher 3 x langsamer als im Inverter. 

� Lösung (L ist bereits minimal): 

W der PMOS wird 3x größer gemacht als im Inverter 

(hier wären die PMOS also (2-3) x 3 = 8x größer als die 

NMOS...) 

� Dies führt jedoch zu sehr großen Eingangskapazitäten, 

insbesondere bei PMOS und bei Gattern mit vielen 'gestapelten' 

Transistoren. 

� Mehr als 3 gestapelte PMOS Transistoren werden daher kaum 

benutzt. 

� NAND Logik ist hier vorteilhaft, weil die PMOS dort parallel sind 

und die Größe nicht erhöht werden muß. 

('etwa 75% aller Logik benutzt NANDs' - laut 'design of high 

performance microprocessor circuits', IEEE Press) 

� Ein NAND mit 3 Eingängen hat also etwa gleich große NMOS 

und PMOS Transistoren. 


a 

b 

c 

a 

W/L 

W/L 

W/L 

b c 

W/3L = 1/3 W/L 


f

� Gleiche 'Pulldown'-Stärke (K P=2K N): 

Layoutvergleich: nor3 vs. nand3 

� (Wannen der PMOS u. Substratkontakte nicht gezeigt!) 

2 W 0 

3 W 0 


nand3 

Evtl. R diff zu 

hoch ! 

bent gate 

Kleinere 

Diffusion bringt 

hier nichts 

Redundanz 

(Yield, 

Widerstand) 

Diffusion 

sparen 

(Kapazität) 

nor3 

6 W 0 

W 0 


Ideale Transistorgröße in komplexeren Gattern 

� Beispiel für relatives W/L eines komplexen Gatters für symmetrisches Schalten bzw. Schwelle = VDD/2 

bei K N=3K P: 

b 

a 

a 

d 

6 

6 

12 

12 

b 

c 

W/L = 3 

W/L = 1 

� Aber: In der Realität (Standardzellbibliotheken) wird dies oft nicht befolgt (gäbe sehr unschöne Layouts). 

� Wenn mehrere Eingänge gleichzeitig schalten, stimmt W/L nicht mehr! 


2 

2 

2 

c 

1 

f 

d 


Kapazitäten der internen Knoten 

� Betrachte z.B. NAND Funktion mit 4 Eingängen: 

� Die Knoten zwischen den NMOS Transistoren haben 

parasitäre Kapazitäten (Dioden) 

� Die unteren Transistoren müssen daher höhere 

Kapazitäten umladen als die oberen: Die Verzögerung ist 

länger 

(Dieser Fall gilt, wenn die Lastkapazität klein oder 

vergleichbar zu den internen Kapazitäten ist.) 

Lösungen: 

� Zeitkritische Signale nahe am Ausgang anschließen 

� Transistoren 'unten' breiter machen, um den 

Durchgangswiderstand zu erniedrigen und die RC-Zeit zu 

reduzieren 

(Diese 'tapered layouts' werden jedoch kaum mehr 

benutzt, da die Layouts sehr unsystematisch werden!) 


Hier muss der Poly-Active Abstand 

eingehalten werden, daher ist der 

Poly-Pitch auf dem Gate nicht 

minimal und die Diffusions- 

Kapazitäten sind unnötig hoch. 

Tapering bringt also nicht viel! 

0⇒1 A4 1 

A1 A2 

A3 

1 

A2 

1 

0⇒11 

A1 


t p im NAND als Funktion des Fan-In 

� Der Serienwiderstand der NMOS führt zusammen mit den Kapazitäten der Zwischenknoten zu einem 

quadratischen Ansteigen der Abfallzeit und damit der Verzögerung t pHL 

� Gates mit hohem Fan-In (>3-4) vermeiden! 


tp (nssec) 

4.0 

3.0 

2.0 

1.0 

quadratic 

linear 

t pHL 

0.0 

1 3 5 

fan-in 

7 9 

t p 

t pLH 

AVOID LARGE FAN-IN GATES! (Typically not more than FI < 4) 


XOR 

� XOR / XNOR sind wichtige Funktionen (Vergleicher, Zähler, Parität) 

A 

B 


4 MOS 

6 MOS 

10 Transistoren 

A B A ⊕ B 

0 0 0 

0 1 1 

1 0 1 

1 1 0 

A⊕B 

A 

B 

je 2 MOS 

8 MOS 


A⊕B 


A 

B 

A 

B 

A B 


CMOS XOR Layout: 10 MOS 

A⊕B 

A B 

f 

B 

A 

4 kritische Punkte. 

Keine durchgehende Diffusion 

bei PMOS möglich ! 

B A 

f 


A 

B 

CMOS XOR Layout: 12 MOS 

A⊕B 

A B B 

A 

A 

A 

B 


B 

A 

B 

A 

B 

f 

A 

B 

A f B 

Die NMOS Transistoren lassen sich nicht 

(?) in der gleichen Reihenfolge anordnen 

Diese Verbindung kann man 

weglassen, ohne die Funktion zu 

beeinträchtigen. (Weil A, !A und 

B, !B immer komplementär sind!) 

Das hintere Gatter ist dann kein 

'echtes' CMOS mehr! 


Volladdierer 

� Der Carry-Pfad muß optimiert werden, da das Carry durch viele Stufen 'rippeln' muß 

C in A B C out S !C out 

0 0 0 0 0 1 

0 0 1 0 1 1 

0 1 0 0 1 1 

0 1 1 1 0 0 

1 0 0 0 1 1 

1 0 1 1 0 0 

1 1 0 1 0 0 

1 1 1 1 1 0 

C out = AB + BC in + AC in 

S = ABC in + !C out • (A + B + C in) 


A 0 

B 0 

A 1 

B 1 

Cin 

Cout 

Cout 

S 0 

S 1 


Volladdierer: Carry-Erzeugung 

� Das Carry wird durch C out = AB + BC in + AC in gegeben. 

� Diese Funktion kann mit dem gemischten Gatter Y = !(AB+(A+B)C in) implementiert werden 

� Problem: 3 PMOS übereinander ('Stack height' = 3) 

� Da je zwei der 5 Eingänge des Y-Gatters identisch sind, kommen nicht alle Eingangskombinationen vor! 

C in 

B A 


A B 

A 

B 

!C out 

B 

A 

� Der PMOS Zweig kann umgeformt werden: 

(!A+!B)(!A!B+!C) = !A(!A!B+!C) + !B(!A!B+!C) 

= !A!B+!A!C+!A!B+!B!C = !A!B + (!A+!B)!C. 

� Das führt zu einem NICHT-CMOS-Gatter: 

B 

C in 

B A 

A 

A 

B 

!C out 


B 

A

Optimierter Volladdierer (invertierte Ausgänge) 

B 

C in 

A 

B A 

A 

B 

!C out 

!C out = !(AB + (B + A)C in) 

!S = !(ABC + !C out • (A + B + C in)) 


B 

A 

C in 

C in 

B 

A 

B A 

kein CMOS ! 


A 

B 

C in 

C in 

B 

A 

!S 


Volladdierer mit alternierenden Stufen 

� Zum Geschwindigkeitsgewinn kann man jeweils invertierte Carry und Sum weitergeben 

� Ein- und Ausgänge jeder zweiten Stufe werden invertiert. 

� Das funktioniert, weil C out(A,B,C in) = !C out(!A,!B,!C in), etc. 

C in A B C out S !C out 

0 0 0 0 0 1 

0 0 1 0 1 1 

0 1 0 0 1 1 

0 1 1 1 0 0 

1 0 0 0 1 1 

1 0 1 1 0 0 

1 1 0 1 0 0 

1 1 1 1 1 0 


A 0 

B 0 

A 1 

B 1 

C in 

C out 

!C out 

S 0 

S 1 


BUFFER 



Treiben großer Lasten 

� Aufgabe: Treibe eine gegebene, große Last mit minimaler Verzögerung ! 

� Beispiele sind Netze mit hohem Fanout, Pads (externe Lasten haben leicht 10pF!), Taktleitungen 

C L 

� Aus tP ~ sieht man, daß man K erhöhen muß, um das hohe CL zu tolerieren. 

K (W/L) VDD 

� Die Eingangskapazität eines großen Inverters ist aber hoch, so daß dieser wiederum schwer zu treiben 

ist. Das Problem ist also nur verschoben. 

klein 

� Man denke auch an die hohen Querströme, die wegen der langsamen Anstiegszeit des Eingangssignals 

im großen Inverter rechts fließen !! 


Verzögerung 

hier 

Verzögerung 

hier 

groß 


Inverterkette als Buffer 

� Lösung: Kette aus zunehmend größer werdenden Invertern. Gesucht: Vergrößerung α pro Stufe 

C IN 

αC IN 

α 2 C IN 

� Die Kette bestehe aus n Invertern, die um jeweils einen Faktor α größer werden 

� Die Verzögerung eines Inverters sei t P = α t P0 

(t (tP0 ist die Verzögerung beim Treiben eines gleichgroßen Inv., das Treiben des α-fach größeren dauert länger) 

� Die Gesamtverzögerung ist T = n t P = n α t P0 

� Es gilt C L = α n C IN oder n = ln (C L/C IN) / ln α 

� Also T(α) = n α tP0 = (α α / / ln α) ln (CL/CIN) tP0 � Hier ist nur α unbekannt. ∂T(α)/∂α = 0 liefert α = e = 2.718... und T min = e ln (C L/C IN) t P0 

� Jeder Inverter ist also etwa 3x so groß wie der vorhergehende 

� Man braucht ln(C L/C IN) Stufen 

� Aus verschiedenen Gründen (z.B. Minimierung des Querstroms oder der Fläche) sind etwas größere 

Verhältnisse (10) oft besser. Die Erhöhung der Verzögerung ist minimal (wenige %, s. Buch v. Veendrick). 


C L 


RC Verzögerung durch Leitungswiderstand 

� Das Treiben einer entfernten Last durch eine lange Leitung trägt die Leitung selbst durch ihr RC zur 

Verzögerung bei. 

0 1 N-1 

R 0 

lange Leiterbahn R 0, C 0: Widerstand / Kapazität pro Längeneinheit 

� Sehr pessimistische ‚worst case‘ Abschätzung = Elmore-Delay: Addition ALLER Rs und ALLER Cs 

N x R 0 

N x C 0 

RC ~ R 0C 0 x N 2 

Grobe Näherung ! 

� Etwas genauer: Widerstand k (k=0..N-1) muß die Kapazität (N-k)C 0 aufladen. Alle RCs addieren: 

RC ~ Σ R 0 (N-k) C 0 = R 0C 0 [N 2 – 0.5 N (N-1)] = R 0C 0 [0.5 N (N+1)] 

k=0..N-1 


C 0 


RC vs. t pd 

� Ein RC Glied erzeugt am Ausgang ein Signal f(t) = exp(-t/RC) 

1 

0.5 

�� Zur Berechung der Verzögerungszeit sucht man t tRC mit f(t f(tRC)=0.5 )=0.5 


0 

t RC 

f(t) = exp(-t/RC) 

⎛ t ⎞ 

tRC 

exp⎜ − = 1 

⎟ ⇔ − = −ln 

RC 693 

2 

⎝ RC ⎠ 

RC 

( 2) 

⇔ t = 0. 

RC 

RC ⋅ 


t

RC Verzögerung mit Zwischen-Buffern 

� Idee: Nach Stücken der Länge M je einen Buffer mit Verzögerung t buf einfügen: 

1 M 1 M 1 M 

� Gesamtlänge: N Elemente 

� Anzahl Segmente: N SEG=N/M 

�� Anzahl Buffer: N NBUF=N/M-1 =N/M-1 


t 

P 

( M) 

= N 

SEG 

⋅ t 

SEG 

+ N 

N 

= ⋅ 0 . 35 ⋅ R R0 

C 

M 

= 0. 

35 ⋅ R 

0 

C 

0 

0 

⋅ N 

BUF 

⋅ t 

BUF 

∂tP 

( M) 

N 

= 0. 

35 ⋅ R0C 

0 ⋅ N − ⋅ t 

2 

∂M 

M 

⇒ M = 

tBUF 

0. 

35 ⋅ R C 

= 1. 

7 

⎛ N ⎞ 

⋅ M ⋅ ( M + 1 ) + ⎜ − 1 ⎟ ⋅ t 

⎝M 

⎠ 

⎛ N ⎞ 

⋅ ( M + 1) 

+ ⎜ − 1⎟ 

⋅ tBUF 

⎝M 

⎠ 

0 

0 

BUF 

= 

t 

R 

0 

0 

BUF 

C 

0 

BUF 

Optimale 

Anordnung 


Beispiel 0.18µm Technologie 

� Betrachte Poly für 10µm lange Stücke, W=0.18µm (10/0.18 ~ 60 Squares) 

� R = 8 Ohm / square, W = 0.18µm. Also R 0=444 Ohm (für 10µm) 

� C ~ 1fF (für 10µm) 

� RC ~ 0.5ps für 10µm 

� Wann wird RC=20ps? 

20ps / 0.5ps = 40, sqrt(40) ~ 6.5 ⇒ Bei L=6.5 x 10µm = 65µm 



VDD 

GND 


Typisches Buffer Layout 

Guardring 

Wannenkontakt 

Substratkontakt 

Drains werden von zwei 

Transistoren geteilt 

⇒ kleineres C 


NMOS LOGIK 



P-Last Logik ('pseudo – NMOS') 

� Die Logische Funktion wird durch ein NMOS Netzwerk erzeugt, eine P-Last zieht nach VDD 

- Das aktive NMOS Netzwerk ist wegen K N > K P vorteilhaft (Mobilität der Elektronen!) 

� Der PMOS wirkt (fast) als Stromquelle 

- Besser ist es, die Gatespannung aus einem Referenzstrom zu erzeugen. Man benötigt dann eine Biasspannung 

- Bei V Gate = GND hängt der Strom stark von VDD ab – schlecht, aber häufig benutzt (kein Bias benötigt) 

GND / bias 

Eingänge 


VDD 

NMOS 

Pulldown 

Netz 

Out 

a b 

nand2 nor2 !((a+b) c) 

c 


Querstrom 

PMOS 


Übertragungsverhalten 

V out 

VDD 

V TN 

VDD 

VDD 

V in 

V Vin = VDD 

V in < VDD 

V in ≤ V TN 

Ausgangsspannung 


SPICE Simulation 

� Hier: 'Simple' – Modelle mit verschieden langen PMOS 

� Langer PMOS: + niedriges Low-Level 

- langsame Anstiegszeit 

� Kurzer PMOS: - hohes Low-Level 

+ schnelle Anstiegszeit 

LP=4u 


LP=1u 

V1 = 0 

V2 = 5 

TD = 10n 

TR = 1n 

TF = 1n 

PW = 100n 

PER = 200n 

in2 

V1 

V 

LP=1u 

W = 1u 

Simple L = {LP} 

MP2 

out 

PARAMETERS: 

LP = 5u 

V 

W = 1u 

Simple L = 1u 

MN2 

C1 

100f 

VDD2 

5 

0 

LP=4u 


Berechnung V OL 

� Berechnung der Low-Ausgangsspannung aus der Ausgangskennlinie von NMOS und Last 

I quer 

V OL 

� NMOS ist im linearen Bereich, PMOS in Sättigung 

� Mit V T = V TN = |V TP|: 

NMOS 

PMOS 

VDD V Vout I NMOS = k N [(V DD – V T) V OL – ½ V OL 2 ] = ½ kP (V DD – V T) 2 = I PMOS 

� k p muß viel kleiner als k n sein !!! 

� Das low-level hängt stark von V DD ab – schlecht! 


V OL = (V DD-V T) [1 – 1 – k P/k N] 


d 

c 

b 

a 

nand4 


out 

Pseudo-NMOS NAND4 Gatter 

VDD 

a b c d 

GND 

out 

n + -Kontakt 

N-Wanne 


P-Last NOR6 

� Hier mit sehr langem PMOS. Sehr kompaktes Layout. 



Vorteile 

� Erfordert nur N+1 Transistoren (N NMOS, 1 PMOS) 

� Topologie sehr einfach 

� Kleine Eingangskapazität 

� Gut geeignet z.B. für Decoder 

Nachteile 

Pseudo-NMOS Logik 

� Statischer Stromverbrauch, wenn Ausgang auf Null ist 

� Abfall- und Anstiegszeiten u.U. stark asymmetrisch 

� Kleiner unterer Störabstand: V IL ~ V TN, V OL > 0 

�� Dimensionierung des PMOS ist kritisch ('ratioed logic'): 

- Er darf nicht zu groß sein, damit die NMOS den Ausgang noch gegen 'Null' (i.e. unter VIL) ziehen können 

- Er darf nicht zu klein sein, weil tpLH dann zu groß wird 

Anwendungen 

� Open-Drain Ausgang. Mehrere Ausgänge können verbunden werden. 

Mit einer Last ergibt sich eine ODER-Verknüpfung 'Wired-OR' 

(eigentlich NOR oder NAND...) 

� Die Last kann an eine andere Spannung angeschlossen werden als VDD: 

- Level-Shifter 

- Gunning Transceiver Logik (GTL) mit niedriger Abschlußspannung 


wired-OR 

Block1 Block2 


Pseudo NMOS mit Adaptiver Last 

� M1 wird aktiv eingeschaltet, wenn die Logik benötigt wird 

� Im ‚stand-by‘ - Modus sorgt ein schwacher M2 (kleines W/L) für statische High-Levels 


enable M1 M2 

A B C 

nor3 

schwacher 

'Keeper' 

Out 


PASS GATE LOGIK 



Pass-Transistor Logik: Nur NMOS Schalter ? 

� Gleiches Problem wie bei CMOS: 

NMOS Transistoren machen 'gute' Nullen, aber 'schlechte' Einsen. 

� Genauer: 

VDD 

VDD 

Spannung hier steigt nur auf 

VDD – k x VTN 

(k durch Substrateffekt) 

� Problem: Statischer Stromverbrauch, Verlust an Störabstand 

� Daher: NMOS und PMOS parallel schalten 

VDD 

� Aber: Wenn man weiß, was man tut, ist u. U. auch nur ein NMOS ok… 


Der PMOS ist nicht 

ganz abgeschaltet 


Pass Gate Logik 

� Elementarer Block: Transmission Gate aus PMOS und NMOS. Symbol wie ein Absperrhahn. 

IO 

� Beispiel Multiplexer 


En 

!En 

A 1 

A 0 

IO IO 

!Sel 

Sel 

Sel 

Q 

En 

!En 

Nur 4 Transistoren! 

IO 


Einschub: Widerstand eines MOS 

� Vom Widerstand kann man nur im linearen Bereich sprechen, d.h. wenn 

� In diesem Bereich gilt: 

0 < V DS « V GS – V T 

I D = K W/L [ (V GS – V T) V DS – ½ V DS 2 ] = K W/L [ VGS – V T – ½ V DS ] V DS 

� In der [] - Klammer kann man ½ V DS gegenüber V GS-V T vernachlässigen, also gilt näherungsweise 

� Also ist der Leitwert des Kanals 

I D ~ K W/L (V GS – V T) V DS 

g DS = I D / V DS ~ K W/L (V GS – V T), der Kehrwert ist der Widerstand 

� Einsetzen von Werten einer 0.35 µm Technologie ergibt (für einen minimalen NMOS bei 3.3V) 


g DS ~ 175 µA/V 2 x 0.8µm/0.35µm x (3.3V – 0.5V) ~ 1mA/V, d.h. 1kΩ 


0 

Vin 

0 

Vtest 

Simulation: Widerstand Transmission Gate 

0.001 

0 

I 

I 

M3 

W = 0.8u 

L = 0.35u 

M2 

W = 0.8u 

L = 0.35u 

VDD 

� Auch hier muss der PMOS breiter als der NMOS gemacht werden 

� Typ. RC : 3kΩ x 3fF = 10ps, aber (3x3kΩ) x (3x3fF)=100ps! 


VDD 

3.3 

PMOS 

W/L= 0.8/0.35 

NMOS 

W/L= 0.8/0.35 

Parallelschaltung 

V D ~ V S 

Durchlasswiderstand hat 

die Größenordnung 1kΩ 


Problem bei niedrigen Versorgungsspannungen 

� Bei modernen Prozessen mit sehr kleinen Gatelängen sinken die Versorgungsspannungen, die 

Schwellenspannungen bleiben aber etwa gleich (wegen Subthreshold Leakage!) 

� Dies führt zu hohen Widerständen von Transmission-Gates im mittleren Spannungsbereich: 

R 

V T,P 

V T,N 

‘Hohe’ Versorgungsspannung 

V IN 

R 

V T,P 

V T,N 

‘Niedrige’ Versorgungsspannung 

� Wenn VDD < k1 V T,N + k2 |V T,P| wird, funktionieren die Schalter nicht mehr! (k1, k2 für Substrateffekt) 


V IN 


A 3 

A 2 

A 1 

A 0 

Sel0 

!Sel0 

Sel0 

!Sel 

0 

Sel 

0 

Sel1 

!Sel1 

Sel1 

MUX4 

Q 

12 Transistoren für 4 Bit ! 

Sel1 Sel0 Q 

0 0 A 0 

0 1 A 1 

1 0 A 2 

1 1 A 3 

� Achtung: Zu viele (>4) in Serie geschaltete Transmission Gates führen zu hohen RC-Verzögerungen! 

� Verzögerung steigt (etwa) quadratisch mit der Anzahl MOS !!! (solange interne Caps dominieren) 



out 

A B A ⊕ B 

0 0 0 

0 1 1 

1 0 1 

1 1 0 

B B out 

A = 1 A = 0 

XOR mit Pass Gate Logik 

B 

A 

A 

A⊕B 

!A 

!B 

Möglichkeit 1: 

MUX 

4 MOS + 2 Inverter 

Vorsicht: Bei der Abschätzung der Geschwindigkeit muss man die MOS in den Schaltungen berücksichtigen, 

die die Signale A und B erzeugen! 


B 

B 

!A 

A⊕B 

B 

Möglichkeit 2: 

Raffiniert! 

4 MOS + 1 Inverter 


Gated Inverter 

� Man kann bei gleicher Funktion das Layout vereinfachen: 

!Sel0 

!Sel0 

Sel0 Sel0 

!Sel0 

Sel0 

!Sel0 

Sel0 

� Die Schalttransistoren ('Sel') kommen nach 'innen' (nahe Ausgang), damit im abgeschalteten Zustand die 

kapazitive Last minimal ist. 



Tri-State Ausgang 

� Die zwei in Serie geschalteten MOS des Gated Inverters kann man verhindern (Ausgangsstrom!), indem 

man Logik vorschaltet. 

� Nicht-Invertierender Tri-State Buffer: 

en 

in 

en ⋅ in 

en ⋅ in 

� Sehr wichtiger Ausgangs-Typ in Bus-Systemen! 


out 

out in 

out 

en=0 

en=1 


RC Verzögerung in Transmission Gates (wie vorher) 

1 2 N 

R eff 

N x R eff 


N x C eff 

RC ~ R effC eff x N 2 

Grobe Näherung ! 

C eff 


D 

!LD 

Latch mit Gated Invertern - Stick Diagramm 

LD 

LD !LD 


Q 

� Sehr kompakt 

D 

LD 

� Die 'extra' Transistoren des Gated-Inverters (im 

Vergleich zu einem Transmission Gate) fallen 

kaum ins Gewicht 

� Problematisch im Layout sind immer die 

Überkreuzungen von LD/!LD bzw. EN,!EN 


Q

Wdh: 'Pseudo'-statisches Latch 

� Implementierung in diesem Beispiel mit Transmission Gates 

D 

LD 

Q 

Q 

D 

� Achtung: Die LD-Signale der Transmission Gates dürfen sich nicht überlappen! 


!LD 

LD 

LD 

!LD 

Q 

Q 


Latch mit 'Keeper' 

� Die Speicherschleife wird nicht mehr ‚aufgebrochen‘ sondern ‚mit Gewalt‘ umgeworfen 

� Ähnlich RAM-Zelle, aber mit asymmetrischen Invertern 

D 

!LD 

LD 

Q 

Schwacher 

Inverter 

� Bringt nicht viel Flächengewinn, da die langen Transistoren im schwachen Inverter viel Platz brauchen 



C in A B C out S P 

0 0 0 0 0 0 

0 0 1 0 1 1 

0 1 0 0 1 1 

0 1 1 1 0 0 

1 0 0 0 1 0 

1 0 1 1 0 1 

1 1 0 1 0 1 

1 1 1 1 1 0 

orange: C Cout = C Cin (P=1) 

weiss: Cout = A (oder B) 

A !A 

C i 

n 

Volladdierer mit Transmission Gates 

!C in 

Vorbereitung XORs: P=A⊕B 


A 

B 

!A 

!A 

B 

A 

P 

!P 

(Ein Inverter für !P wäre langsamer) 

(P = ‚propagate‘) 

B 

B 

!C in 

C in 

!A 

!C in 

P 

P 

!P 

P 

!P 

MUXe: S=P⊕C in, C out=.. 

S 

C out 

kritischer Pfad 


'NMOS –Only' Transmission Gate Logik: ‚Level restore‘ 

� ‚NMOS-Only‘ geht nicht direkt wegen des schlechten High-Pegels, statischen Stromverbrauchs etc. (s.o.) 

� Trick: Nutze einen PMOS 'Level-Restorer' um aus einer 'schlechten 1' ein VDD Niveau zu machen. 

⇒ 'full swing' wird wiederhergestellt: 

A 

B 

Q = !A • B 

X 

� Vorsicht: der PMOS muss richtig dimensioniert werden, damit auch 'schwache' Nullen bei A (z.B. aus 

seriellen NMOS Transistoren) den Knoten X noch nach Masse ziehen können 


Q 


Komplizierter: Manchester Carry Chain Addierer 

φ 

C i,0 

P 0 

P 1 

V DD 

P 2 

M0 M1 M2 M3 M4 

3 2.5 2 1.5 

3.5 3 2.5 2 1.5 1 

G 0 G 1 G 2 G 3 G 4 

� Sehr kompakte und schnelle ‚full custom‘ Lösung zur Erzeugung von Carry. 

� Hier nicht weiter diskutiert…. 


4 3.5 3 2.5 2 

φ 1.5 

P 3 

P 4 

1 

0.5 

Total Area: 

225 µm × 48.6 µm 

C o,4 


DIFFERENTIELLE 

CMOS LOGIK 



Differenzielle Logik 

� Einige Logikfamilien erzeugen einen Ausgang Q und das Inverse !Q. 

� Sie benötigen neben den Eingängen I 1,...,I N meist auch die Inversen !I 1,...,!I N 

Vorteile: 

� Es werden viel weniger Logikfunktionen benötigt, da durch Vertauschen von Signalen die Negation 

erreicht wird. Für Fan-In = 2 werden nur 2 Gatter benötigt. Frage: Wieviele für Fan-In = 3? 

A 

!A 

B 

!B 

A • B 

Q 

!Q 

� Auch Funktionen mit Zustandsspeicherung sind sehr kompakt 

A 

!A 

B 

!B 

� Anstiegs- und Abfallzeit sind gleich. 

� Man kann mit kleinerem Signalhub arbeiten 

Nachteile: 

� Es müssen doppelt so viele Signale verlegt werden 

� Die Leistungsaufnahme bei 'full swing' Signalen wird verdoppelt 

� Es werden mindestens 2N+2 Transistoren für ein Gatter mit einem FanIn von N benötigt 


A • B 

Q 

!Q 

A 

!A 

B 

!B 

A + !B = !A • B 

Q 

!Q 


DCVS Logik 

� DCVSL = differential (dual) cascode voltage switch logic 

� Ein 'Latch' aus zwei PMOS Transistoren wird von zwei komplementären NMOS – pulldown Netzen 

umgeschaltet 

� Durch positives Feedback ist das Umschalten sehr schnell, auch wenn die Eingangssignale langsam sind 


Eingänge 

out 

out 

Pulldown: 

F(i) 

Pulldown: 

!F(i) = F'(!i) 

(duales Netz) 

Eingänge 


DCVS NAND 

out out 

a 

b a b 

Pulldown: 

F = !(ab) 

Pulldown: 

!F = !!ab = !(!a+!b) 

� Dieses Gatter kann für jede Funktion von zwei Variablen verwendet werden, in der genau einer der vier 

möglichen Ausgangszustände ausgewählt wird. 



a ⊕ b 

DCVS XOR 

b 

b b b 

a a 

a ⊕ b 

A B A ⊕ B 

0 0 0 

0 1 1 

1 0 1 

1 1 0 

� Dieses Gatter kann für jede Funktion von zwei Variablen verwendet werden, in der genau zwei der vier 

möglichen Ausgangszustände ausgewählt werden. 



a+(bc) 

a 


DCVS Beispiel mit 3 Eingängen 

b a 

c b c 

a+(bc) 

F = a + (b⋅ 

c) F = a + (b ⋅c) 

= a⋅ 

(b ⋅c) 

= a⋅ 

( b + c) 


V 

DCVS Inverter 

� Simulation mit PSPICE mit sehr langsamen Eingangssignalen (Anstiegs/Abfallzeit = 1µs) 

� Hier (W/L) P = (W/L) N 

inleft 

Simple Pleft 

V 

Vleft 

V1 = 0 

V2 = 5 

TR = 100n 

outleft 

Nleft 

Simple 

VCC 

0 

Pright 

outright 

Nright 

Simple 

Simple 

V 

V 

inright 

Vright 

V1 = 5 

V2 = 0 

TR = 100n 

Eingang rechts 

Eingang links 

� Ausgang ist sehr schnell durch das positive Feedback 


Ausgang links 

Ausgang rechts 

1µs ! 



Detail: Querstrom beim Umschalten 

Querstrom 300µA 


Ähnlich JK-FF: Getaktetes SR – FlipFlop 

� Sehr einfache Schaltung möglich: 

� Kreuzgekoppelte Inverter, die umgeworfen werden (ähnlich statische Speicherzelle) 

� Achtung: 'ratioed' Design: PMOS Transistoren dürfen nicht zu stark sein, sonst 'flippt' die Zelle nicht 

PHI 

S 

Q 


Q 

PHI 

R 

Simulation @ 3V, L NMOS = 0.25µm 

L PMOS = 0.25/0.5/1 µm 

V Q,V !Q 

V PHI 


Vorteile: 

� Statische Logik 

� kein DC-Stromverbrauch 

� Kleine Eingangskapazitäten 

� Schnelles Umschalten durch positive Rückkopplung 

� Volle CMOS Levels 

DCVS Logik 

� Weniger Gatter benötigt durch Verfügbarkeit der inversen Signale und durch komplexe Logikfunktionen 

Nachteile: 

� Mehr Transistoren 

�� 'Ratioed Logik': PMOS darf nicht zu groß sein 

� Hoher Querstrom beim Umschalten. NMOS-Netz treibt 'gegen' den PMOS bis er umschaltet 

� Höherer Routing-Aufwand durch komplementäre Signale 

� Höherer dynamischer Leistungsverbrauch 

(Nicht so klar: Doppelt so viele Signale, aber kleinere Eingangskapazitäten) 

Ausblick: 

� Es gibt auch differentielle CMOS Logikfamilien, die einen kleinen Signalhub haben 

� Viele Vorteile, aber schwierigeres Design 

� Sehr ähnlich wie ECL, aber mit MOS Transistoren 



� CML = 'Current Mode Logik' 

CML 

� Gleiches Konzept wie Differential ECL aber ohne Emitter-Folger 

� Der Strom wird im Schalterbaum nach links oder rechts gelenkt 

� Durch das Fehlen des Buffers können große Lastkapazitäten schlecht getrieben werden. 

� Problem ist der Last-'Widerstand': 

- Ausgangslevels müssen zum Eingang passen 

- Levels sollten nicht stark vom Strom abhängen 

- Es gibt verschiedene Lösungen... 

� Schalterbaum ist wie bei DCVS 

� Umschaltspannungen sind (in starker Inversion) 

höher als bei ECL, in schwacher Inversion vergleichbar. 

� Einer der Vorteile: 

Konstantstromoperation - keine Spikes auf Versorgung 


VDD VDD 

Lasten 

Q !Q 

Schalterbaum 


a ⊕ b 


CML XOR 

b b b 

a a 

a ⊕ b 


Q !Q 

!A A 

A 

!A !Q 


Inverter / Buffer 

Q 

CML LATCH 

Rückkopplung 

(wie bei CMOS) 

Q 

A 

1 0 1 0 

Q 

!A !Q 

0 1 0 1 

Latch (Speicherzelle) 

!Q 


LD = 10 


Q 

D – Latch in Differenzieller Logik 

D 

D 

LD LD 

Q 


DYNAMISCHE LOGIK 



φ 

I 1 

I 2 

I N 

φ 


Dynamische Logik mit 'Precharge' 

NMOS 

Pulldown 

Netz 

Q 

2 Phasen: 

Precharge (φ=0): 

Ausgang wird auf 1 vorgeladen 

Evaluation(φ=1): 

Dieser NMOS unterbindet 

einen Querstrom während 

der Precharge-Phase 

Ausgang geht auf 0, falls pulldown aktiv. 

Nur EIN Übergang nach 0 ist möglich. 

Ähnlich: Komplementäre Schaltung mit PMOS pullup-Netz. 



Beispiel Dynamische Logik 

a 

b 

φ 

φ 

Q 

c 

Q = !(ab+c) 


φ 

c 

b 

a 

φ 


Layout eines dynamischen NAND3 Gatters 

Q 

c 

b 

a 

VDD 

phi 

GND 

out 

Sehr kleine 

Kapazität 

Größere 

Kapazität 


Vorteile: 

� Nur N+2 Transistoren 

� Sehr einfache Layouts 

Dynamische Logik 

� Ratio-Less: Die Größe der Transistoren ist (relativ) unkritisch 

� Kein statischer Stromverbrauch 

� Schnelle Evaluation, da nur NMOS Kapazitäten 

� Full swing Logik 

Nachteile: 

� Kleiner unterer Störabstand (~V TN) 

� Benötigt Taktsignal 

� Nicht kaskadierbar.... 

� Probleme durch Leckströme... 

� Probleme durch Ladungsumverteilung... 

� Probleme durch Ladungsinjektion... 



φ 

D 

φ 

I leak 

Problem: Leckströme 

C L 

Q 

� Während der Evaluationsphase ist der Ausgang z.T. dynamisch. 

� Die Gesamtkapazität C L kann dann durch Leckströme I leak mit ∆U/∆T = I leak/C L entladen werden. 

� Hauptanteile an I leak kommen von den Draindioden der MOS und Subthreshold-Strömen 


φ 

D 

Q 

precharge, 

Q ist 

statisch 

Q ist dynamisch, 

Entladung duch 

Leckströme ! 

Q ist 

statisch 


t 

t 

t

φ 

a 

b 

φ 

� Schwacher PMOS hält Ausgang auf VDD 

Maßnahmen gegen Leckströme 

� Statischer Stromverbrauch während Evaluation 

� Ähnlich clocked pseudo-NMOS 


Q 

φ 

a 

b 

φ 

� Wie ‚Level Restore‘ bei Pass Gates 

� Solange Q Null ist wird der dynamische Knoten 

mit einem PMOS nach 1 gezogen 

� Wird der dynamische Knoten in der Evaluation 

nach 0 entladen, so ‚lässt der PMOS los‘ 

Q 


Problem: 'Charge redistribution' 

� Die Ausgangsspannung kann unerwünscht einbrechen, wenn ein entladener parasitärer Kondensator (hier 

zwischen MN2 und MN3) mit dem Ausgang verbunden wird. 

� Dies kann passieren, obwohl der Ausgang auf high bleiben sollte (Beispiel NAND, Eingang 'inlo' ist 0) 

V 

V 

V 

MP 

phi 

MN3 

inhi 

inlo 

MN2 

MN1 

out 


0 

V 

V0 

3V 


Einfluß der Kapazitäten 

� Drain des PMOS vergrößert ⇒ Kapazität des Ausgangsknotens größer ⇒ kleinere Störung 


PHI 

Oberer 

Eingang 

AD = 6.4p 

AD = 0.64p 


φ 

a 

b 

φ 

Gegenmaßnahme: Vorladen von Zwischenknoten 

φ 

Q 

� Alle Zwischenknoten (oder zumindest kritische mit viel Kapazität) werden vorgeladen. 

� Nachteil: totale Kapazität steigt, mehr Transistoren, höhere Last an Taktleitung 

� Alternativ: Zwischenkapazitäten sehr klein halten (Diffusion minimal, keine Kontakte) 



φ 

in 

Problem: 'Clock Feedthrough' 

Q 

Ladungsinjektion 

in ⇒ Q 

Ladungsinjektion 

Phi ⇒ Q 

Ausgang 

Takt 

t tr=1ns =1ns / 0.1ns 

� Das Taktsignal kann durch die Gate-Drain Kapazität des PMOS auf den Ausgang durchkoppeln 

� Die Stärke des Effekts hängt von der Anstiegszeit des Taktsignals und den Kapazitätsverhältnissen ab. 

� Der Effekt kann positiv ausgenutzt werden, da er den Störabstand erhöht. Etwas charge redistribution 

stört dann nicht mehr… 



φ 

1 

Problem: Kaskadieren von N-Typ Precharge Gates 

Q 1 

φ φ 

φ 

Q 2 

1 1 

φ 

Q 1 

Eingang = 1! 

Q 1 = 1! 

� Direktes Kaskadieren von N-Typ precharge Gattern funktioniert NICHT, weil die Einsen in den vorderen 

Gattern (nach dem Precharge) die hinteren Gatter umschalten. Diese können dann nicht mehr den 

korrekten Wert annehmen, da pro precharge Phase nur EIN 1-0 Übergang möglich ist. 

� Lösungen: Inverter einfügen, N- und P- Stufen abwechseln 


Q Q2 Q 2 müßte jetzt wieder auf 1 springen 

(Eingang des Gatters = 0), das geht 

in der dynamischen Logik aber nicht! 


� Füge einen Inverter hinter jede N-Stufe 

Lösung1: Domino Logik 

� Die Ausgänge sind dann in der Precharge-Phase NULL und es gibt kein Problem 

� Problem: Alle Gatter sind NICHT-invertierend ! 

φ φ 

A 1 

A 2 

A N 

φ 

NMOS 

Pulldown 

Netz 

B 2 

B N 

φ 

NMOS 

Pulldown 

Netz 

Level Restorer 

(schwacher PMOS) 

Beobachtung: Den unteren NMOS in den hinteren Stufen kann man weglassen (bei Phi=0 sind alle B i=0)! 



Domino Effekt 

� Das Signal propagiert von links nach rechts durch und wirft eine Zelle nach der anderen um ('Domino') 

φ 

0 

0 


0 0 0 

Gatter 1 Gatter 2 Gatter 3 


� Abwechselnd N-Stufen und P-Stufen benutzen 

� Precharge der P-Stufen benutzt den inversen Takt. 

� Nachteil: PMOS-Teile sind langsamer 

φ 

A 1 

A 2 

A N 

φ 


Lösung2: NP-CMOS 

NMOS 

Pulldown 

Netz 

Q 1 = B 1 

φ 

B 2 

B N 

φ 

PMOS 

Pullup 

Netz 

Q 


P-Pullup 

φ 

A1 

φ 

Beispiel: NP CMOS Volladdierer (2 Bit) 

VDD 

B 1 

φ 

B 1 

A 1 

Carry (zeitkritisch)nahe Ausgang 

C i0 

φ 

φ 

Carry In 


V DD 

φ 

A 0 B 0 B 0 

N-Pulldown 

A 0 

φ 

Carry Out 

VDD 

C 2 

C i1 

A 1 

A 0 

N-Pulldown 

φ 

B 1 

φ 

φ 

B0 

φ 

V DD 

C i1 

V DD 

C i0 

A 1 

B 1 

φ 

V DD 

φ S1 

C i1 

V VDD Optimiertes Design: zweiter NMOS 

pulldown, um Kapazitäten der 

Zwischenknoten zu reduzieren 

φ 

B 0 

A0 Ci0 S 0 

Bit 1 

Bit 0 


Beispiel: breites UND Gatter (Adressen-Decoder) 

� Betrachte UND Gatter mit 5 Eingängen. y = a 1a 2a 3a 4a 5 = !(a 1+a 2+a 3+a 4+a 5) 

ck 

a 3 

a 2 

a 1 

ck 

ck 

a 5 

a 4 

ck 

y ck 

!a 1 !a 2 !a 3 

y springt nur auf 1, wenn alle a i high sind !y bleibt nur auf 0, wenn alle !a i low sind 

Implementierung als Domino UND 


ck 

ck 

ck 

!a 4 

!a 5 

Implementierung als Domino ODER 

Weniger NMOS in Serie: BESSER 

!y 


Beispiel: breites UND Gatter (Adressen-Decoder) 

� Zum Vergleich: Implementierung als NP ODER. Die Logik im zweiten Gatter wird umgedreht 

!a 1 

ck 

ck 

!a 2 

1 

!a 3 

!ck 

a 4 

!ck 

y bleibt nur auf 0, wenn !a 1-!a 3 low sind a 4-a 5 high sind. 

� Sehr kompakt. Kann sehr einfach auf sehr viele Eingänge erweitert werden. 


a 5 

0 

y 


Beispiel: breites ODER (z.B. f. Match im CAM) 

� Betrachte ODER mit sehr vielen Eingängen: 

a 1 

ck 

a 2 

ck 

�� Nachteil: 2 Transistoren in Serie können sehr große Bus-Last nicht so schnell umladen. 

a 3 

ck 

� Lösung: NMOS unten vermeiden, indem die a i während des Precharge (ck=0) abgeschaltet werden: 

a1 ck 


a2 ck 

a3 ck 

a 4 

ck 

ck 

ck 


Konzepte: 

� Domino oder NP Logik 

Zusammenfassung dynamische Logik 

� Level Restorer zur Reduktion von Leckströmen – 'pseudo-statisch' 

� Evtl. Precharge von internen Knoten! 

Vorteile: 

� Sehr kurze Durchlaufzeit in der Evaluationsphase (bis zu 2x schneller) 

� Full swing 

� Nicht 'ratioed' 

� Sehr einfache und kompakte Layouts 

Nachteile: 

� Nur nicht-invertierende Funktionen 

� Benötigt Takt 

� (Speicherzeit begrenzt) 

� Störabstand gering 

� Vorsicht vor Ladungsumverteilung (charge-redistribution) 

� Höherer Stromverbrauch durch Takt (bis zu 2x höher). 

Hängt auch von der Polarität der Implementierung ab. 



FLIPFLOPS IN 

DYNAMISCHER LOGIK 



Dynamische Logik 

� In dynamischer Logik werden Knoten für kurze Zeit nicht getrieben. 

� Sie behalten ihren Spannungszustand durch die Kapazität des Knotens. 

� Die Speicherzeit ist beschränkt durch Leckströme (Dioden, Subthreshold Leitung der MOS) 

� Beispiel: Dynamisches Latch: 


!LD 

D Q 

LD 


CK 

D 

Dynamisches Ein-Phasen-FF 

!CK 

!CK CK 

� Vorsicht: CK und !CK müssen genau komplementär sein, sonst ist das FF für kurze Zeit transparent. 

Beste Lösung: interne Erzeugung von !CK. 

� Vorsicht: Klappt nicht bei langsamer Anstiegszeit von CK. Lösung: CK puffern (zweiter Inverter). 


Q 


� Wie vorher, aber mit Gated Invertern. 

� Layout manchmal angenehmer 


CKin 

Ein-Phasen FF: C 2 MOS 

!CK CK 

D 

Q 

CK 

!CK 


'Echtes' Ein-Phasen dynamisches LATCH 

� Vermeidet das Problem des Überlappens von CK und !CK in FFs 

� Gibt es ähnlich mit invertiertem Ausgang und/oder invertierter Clock (PMOS in die Mitte) 

� Funktion: - Bei CK=1 (transparente Phase) hat man zwei in Serie geschaltete Inverter. 

- Bei CK=0 behält der Ausgang Q seinen Zustand dynamisch bei: 

Eine 1 bei Q kann nicht zu 0 werden, weil der hintere NMOS sperrt. 

Eine 0 bei Q kann nicht durch den PMOS zu einer 1 werden, weil der Zwischenknoten nicht 0 werden kann. 


Zur Stabilisierung einer 1 

am Zwischenknoten 

D Q 

CK CK 


True Single Phase Clocking: Svensson - FF 

� Durch geschicktes Hintereinanderschalten von single-Phase Latches bekommt man ein sehr schnelles und 

kompaktes Single-Phase-FF (hier auf positive Flanke getriggert) (Yuan, Svensson, 1989) 

D 

CK 

01 !D 

01 

CK 

CK 

a 

01 

� Funktion: - bei CK=0 ist der Ausgang hochohmig. Am Punkt a liegt !D an. Punkt b ist auf 1. 

- bei CK=1 und D=0: a ist 1. b springt auf 0. Ausgang geht auf 1 (=!D). 

Falls D jetzt noch auf 1 schaltet, geht a auf 0. b wird tristate 0, 

der Ausgang bleibt dabei unverändert! 

- bei CK=1 und D=1: a ist 0, der mittlere Teil blockiert. b bleibt auf 1, Ausgang geht auf 0 (=!D). 

Falls D jetzt noch auf 0 schaltet, wird a tristate. 

� Operation sehr trickreich 

� Dynamisch! Vorsicht vor Ladungsumverteilung und Ladungsinjektion. Sehr riskantes Design 

� In die erste Stufe kann zusätzlich Logik eingebaut werden 


1 

b 

CK 

01 

0 

Q 

Z 


TSPC - True Single Phase Clock Logic 

� Bei Implementierung mit Latches kann 

- Logik in die PU/PD Netze eingebaut werden 

- Logik zwischen die Stufen eingebaut werden 

In 


V DD 

PUN 

φ φ 

PDN 

Including logic into 

the latch 

V DD 

Static 

Logic 

V DD 

V DD 

φ φ Out 

Inserting logic between 

latches 


Noch mehr TSPC 

� D-Flipflop, auf positive Flanke getriggert, 'split-output-latch' 

D 

φ 

V DD 

φ 

φ 

X 

V DD 

Y 

φ 

V DD 

D 

D 

φ 

V DD 

φ 

φ 

V DD 

φ 

V DD 

(a) Positive edge-triggered D flip-flop (b) Negative edge-triggered D flip-flop 

D 


φ 

V DD 

φ 

V DD 

V DD 

(c) Positive edge-triggered D flip-flop 

using split-output latches 

D 

D 


Vergleich einiger Logikfamilien 

� CPL = 'Complementary Pass Transistor Logik': Differentielle Pass-Transistor Logik mit NMOS Transistoren 

mit (technologisch) reduzierter Schwelle. 

� Vorteile der Dynamischen Logik werden durch Zeitbedarf für Precharge relativiert 



Zum Abschluß: Eine wahre Geschichte 

� In einem Design in 0.8µm Technologie befand sich folgende Struktur: 

PHI 

FF1 

� Beobachtungen: 

1mm lange Leitung 

- Bei kleiner werdender Versorgungsspannung gehen Einsen verloren 


Blaue Messung 

(nächste Seite) 

FF2 

Lila Messung 

(nächste Seite) 


Messung: auf der 1mm Leitung und hinter FF2 


VDD = 4.8V 




VDD = 4.5V 

1 verloren 



3.7 V 



Erklärung 

� Schaltplan hinterer 'slave' Teil des FFs (schematisch) 

!CK 

CK 

Inv1 Inv2 

CK C BUS 

!CK 

� Nach der steigenden Flanke der Clock (CK=0..1) steigt das Eingangssignal an. Die Rückkopplung ist 

unterbrochen 

� Wenn CK=0 wird sollte sich am Ausgang nichts ändern. Die Feedback-Schleife wird geschlossen. 

� Ist der Ausgang noch nicht über die Schwelle des Inverters 1 angestiegen, so wird aber eine 0 

abgespeichert!!!! 

� Lösung: Ein (Minimum-Size) Buffer hinter dem FF genügt um die Geschwindigkeit mindestens zu 

verdoppeln... 



Die Simulation zeigt den Effekt 

� Simulation mit extrahierten Kapazitäten der Leitung ergaben: 


1.7-1.8 pF 

1.9-2.0 pF 


ECL 



Zentrales Element von ECL: das differentielle Paar 

� Der Strom im bipolaren Transistor ist I C ~ I S exp(U BE/U TH). 

Dabei ist der Sättigungsstrom I S eine Bauteilkonstante, und U Th = kT/q ~ 26mV@300K die Temperaturspannung. 

V 1 

I C1 


I C2 

I 

C1 

= I 

S 

⎛ V − V 

exp⎜ 

1 

⎝ UTh 

E 

⎞ 

⎟, 

⎠ 

I 

C2 

= I 

S 

⎛ V − V 

exp⎜ 

2 

⎝ UTh 

V2 ⎛ V1 

− VE 

⎞ 

IS 

exp⎜ 

⎟ 

V I ⎛ − ⎞ ⎛ ∆ ⎞ 

E C1 

⎝ UTh 

⎠ V1 

V2 

V 

⇒ = 

= exp⎜ 

⎟ = exp⎜ 

⎟ 

I C 2 ⎛ V 2 − V E ⎞ 

⎜ ⎟ 

⎝ UTh 

⎠ ⎝U 

Th 

I exp⎜ 

⎟ 

⎝ UTh 

⎠ ⎝U 

Th 

I 

⎠ 

S exp 

⎝ UTh 

⎠ 

I EE 

EE 

IEE IC1 

+ IC2 

IC2 

−x 

∆V 

= = 1 + = 1 + e mit x = 

I I I 

U 

C1 

x 

C1 

C1 

IC1 e 

∆U 

= = α mit x = 

I 

x 

1 + e 

U 

Th 

E 

⎞ 

⎟ 

⎠ 

Th 


Zentrales Element von ECL: das differentielle Paar 

� Strom im bipolaren Transistor I C ~ I S exp(U BE/U TH). Rechung s. Tafel. 

� Ergebnis: 

� Mit α = 0.01 ergibt das nur 115 mV (unabhängig von I EE!) 

� Kleiner Signalhub & die bipolaren Transistoren kommen nie in Sättigung ⇒ schnell. 

� SPICE Simulation: 

0Vdc 

V1 

Q1 

x 

IC1 

e 

∆U 

α 

= = α mit x = ⇒ V = V ± U ⋅ ln 

x 

IL , IH ref Th 

I 1 + e 

U 

1 − α 

EE 

Q2N2222 

1m 


I 

Q2N2222 

I1 

Q2 

I EE=1mA 

I 

V2 

0 

5V 

Th 

99% bei 

115mV 


ECL 

� ECL = 'Emitter Coupled Logik' - sehr schnelle Logik mit bipolaren Transistoren 

� Ein differentielles Paar lenkt I EE in einen der beiden Lastwiderstände. 

� Meist sind Ausgang und Komplement verfügbar. 

� Signalhub: ∆U = I EE x R C « V CC: 'low swing' (bei ECL: ca. 800mV) 

V CC 

V out1 

Last 

des 

E-Folgers V TRM 


V in 

Lastwiderstände 

V CC 

R C 

Differenzielles 

Paar 

I EE 

V EE 

Stromquelle 

V Ref 

V CC 

V out 

Emitter-Folger zum 

Treiben der Leitungen 

und der nächsten Stufen 


V CC2 

0 V 

A B 

V EE 

OR/NOR Gate mit mehr Details 

~-1.3 V 

NOR OR 

Differentieller Verstärker Referenz Emitterfolger 

V CC2 

0 V 

~-0.85 V 

~-1.75 V 

V TERM 

-5.2 V ~ -2 V 



ECL: Differenzverstärker und Emitterfolger 

V CC2 Spannungen V' hier: 

- V CC2 

- V CC2-R C×I EE 

A B 

V EE 

(Großer) 'Pulldown'- 

Widerstand (~50kΩ) zieht 

offene Eingänge auf 'low' 


Spannungen hier: 

- V' - V BE 

V ref muß zwischen 

V hi und V lo liegen 

'Schlechte' Stromquelle 

wird mit Widerstand 

(780Ω) implementiert 

Pulldown Widerstände z.B. 50Ω 

oder 100Ω zur Anpassung an die 

Leitungsimpedanz 

NOR OR 

V CC2 

V TERM 

V TERM meist > V EE 

zur Reduktion des 

Leistungsverbrauchs 



Erzeugung der Referenzspannung 

V REF ~ X - V BE 

V CC2 

V REF 

V EE 

GND 

907Ω 

4.98kΩ 

-5.2V 

Spannung X durch 

resistiven Teiler + 

Dioden festgelegt 

Dioden zur 

Temperaturkompensation 


Wired-OR in ECL 

� Mehrere Ausgänge können direkt verbunden werden. Sie bekommen nur einen Pulldown-Widerstand. 

� Diese 'Wired-OR' kostet keinerlei Resourcen und spart Leistung 


Gatter1 Gatter2 

A+B 

V CC2 

A+B+C+D 

V TERM 

V CC2 

C+D 


ECL Gatter 1967 

� Bipolare Transistoren (und damit ECL) gab es lange vor CMOS ! 

B 

C 

E 


v 1 

A 

B 

v 2 

C 

n + 

n - 

v cc 

v 3 

R C1 

GROUND 

E 

n + 

p - 

R C2 

v bb 

v 02 

v 01 

R R E R E 

B 

p + 

C 

n + 


Vorteile: 

� Statische Logik 

Zusammenfassung ECL 

� Sehr schnell (hohe Ströme, kleiner Hub, hohes g m der Bipolar-Transistoren), t p ~ 50ps 

� DC-Stromverbrauch (Konstantstrom!, keine 'Spikes' in der Versorgung) 

� Kurzschließen von Ausgängen ergibt eine ODER-Funktion ('Wired OR') 

Nachteile: 

� Hoher Stromverbrauch pro Gatter (100µA .. 1mA!) 

� V REF muß innerhalb des Signalhubs liegen. Absolutes Matching zwischen Chips nötig! Daher Signalhub in 

single ended ECL = 800mV » 115mV 

�� NAND Gatter unvorteilhaft wegen gestapelter Transistoren, die in Sättigung geraten können 

� Benötigt separates VTT (kann durch äquivalenten Spannungsteiler zwischen V CC und V EE ersetzt werden) 

� Inzwischen von DSM CMOS 'eingeholt' 

Verbesserung Differentielles ECL: 

� Anstelle V REF wird ein zweiter Eingang benutzt. 

� Man hat dann alle Vor/Nachteile von komplementärer Logik 

� Differentieller Eingang hat relativ gute 'Common mode rejection' 

(Ausgang bleibt unverändert, wenn sich DC-Niveau beider Eingänge gleichzeitig ändert) 

PECL, LVPECL: 

� Zur besseren Integration in CMOS inzwischen auch ('Positive ECL') mit VEE=GND, VCC=5V/3V 



TTL 



Vorläufer: Diode-Transistor-Logik (DTL) 

� Verwendung in früher (diskret aufgebauter) Logik 

� Beispiel NAND2-Gate: 

V CC 

Knoten wird auf '0.7V' 

gezogen, sobald mindestens 

einer der Eingänge 0V ist. 

Sonst ist er auf V CC-Potential 

– Ausgangsstrom des High-Levels wird durch Pullup-Widerstand limitiert 

– Low-Level ist nicht ganz GND (wie bei P-Last Logik) 

+ Ausgänge können verbunden werden und bilden so ein 'Wired-AND' 

� NOR Gate wird durch wired-AND gebildet: !(A+B) = !A ⋅ !B 


A 

Knoten ist (idealisiert) 

0V oder '0.7V' (wegen B-E-Diode) 

B 

GND 

v cc 

Q 

Ausgang ist 

V CC oder (fast) Masse 

Transistor ist 

'OFF' oder 'ON' 

Q 

B A 

NOR2 


Frühe Transistor-Transistor-Logik (TTL) 

� Eingangsstufe von DTL wird durch Transistoren ersetzt 

� Beispiel NAND2-Gate: 

C 

n + 

n - 

A B 

E 

n + 

Knoten ist (idealisiert) 

0V (A oder B = GND) oder 

'0.7V' (BE-Diode von M3) 

� Die Ansteuerung des Transistor-Gates ist verbessert 

� Die Low-Level am Eingang müssen sehr niedrig sein (V IL = 0.8V bei V CC = 5V)! 

� Ausgangsstrom des High-Levels immer noch durch Pullup-Widerstand limitiert. I L » I H 

� Ausgänge können verbunden werden und bilden so ein 'Wired-AND' 


p - 

E 

n + 

B 

p + 

V CC 

A 

B 

GND 

M3 

Q 


TTL mit Totem-Pole Ausgang 

� Ausgangsstufe wird durch zwei Transistoren ersetzt, die nach V CC oder Masse ziehen. Beispiel NAND2: 

A 

B 

V CC 

0V / 1.6V 

4kΩ 1.6kΩ 130Ω 

V CC / 0.8V 

GND 

� High-Level wird mit Transistor erzeugt, 

der abgeschaltet werden kann. Daher niedrigerer Stromverbrauch 

� Kein 'Wired-AND' am Ausgang mehr möglich 

M3 

Diode verhindert 

Stromfluß in M3 

für Q=GND 

� NOR Gates etwas komplizierter 

� Verbesserungen: Schottky-Diode verhindern Sättigung der Transistoren ⇒ 74Sxx oder 74LSxx (low power) 


GND / 0.8V 

1kΩ 

Q 

V CC-ε / 0V 

NOR2 


0Vdc 

in 

VIN 

Q1 

4k 1.6k 

a 

Q2 

1k 

⇒ SPICE Simulation 


V 

c 

b 

V 

SPICE Simulation TTL Inverter 

V 

Q4 

Q3 

130 

out 

I 

V 

V2 

0 

5V 

V(b) = V(c) 


TTL Familien 

� Es gibt mehrerer verschiedene TTL Logikfamilien, die sich in der Geschwindigkeit, Leistungsaufnahme 

und der Treiberfähigkeit (Fan-Out) unterscheiden. 

� Grundidee bei den 'S' Familien ist der Einsatz von schnellen Schottky-Dioden (Metall-Si-Diode mit 

'Schwelle' von wenigen 100 mV), um die Sättigung der Bipolartransistoren (Kollektor wird wesentlich 

negativer als Basis, so daß die Basis-Kollektor Diode leitet) zu vermeiden: 

� Familien: 

- 74Sxx Schottky 

- 74LSxx Low Power Schottky 

- 74ASxx Advanced Schottky 

- 74ALSxx Advanced Low Power Schottky 

- 74Fxx Fast 

- .... 


¼ 7400 

Dioden kappen 

negative 

EIngangssignale 

¼ 74S00 ¼ 74LS00 


BiCMOS Logik 

� Durch die gleichzeitige Benutzung von Bipolar- und CMOS Transistoren auf einem Chip hat man mehr 

Möglichkeiten. 

� Meist werden die bipolaren Transistoren in Treiberstufen eingesetzt, um effizient hohe Kapazitäten 

umzuladen 

� In den meisten Technologien sind bipolare Transistoren jedoch nicht verfügbar... 



� Bipolare Logiken (TTL, ECL) auf dem Rückzug 

� Mit NMOS und PMOS mehrere Möglichkeiten: 

- CMOS 

- P-Last-Logik 

- Pass-Gate-Logik 

- Dynamische Precharge Logik 

- Differentielle Logiken 

- andere... 

� Absoluter Mainstream (≥ 95%) ist CMOS 

Zusammenfassung 

�� Andere Typen in Nischen (Decoder, Sensorik, 'handoptimierte' Blöcke wie Addierer oder Multiplizierer...) 

� Als diskrete ICs entstehen immer neue Familien mit feinen Unterschieden: 

- Versorgungsspannung 

- Treiberfähigkeit 

- Dynamischer Stromverbrauch vs. Geschwindigkeit 

- Signalpegel 

- Kompatibilität mit anderen Familien (z.B. mit TTL: Schwelle muss niedriger liegen) 



VERMISCHTES 



� Sender hat NMOS Open-Drain Ausgang 

GTL Ausgangspegel 

� Externe Terminierung zu einer (niedrigen) Spannung VTT definiert High-Pegel 

� Niedrige Signalpegel reduzieren Elektromagnetische Emissionen (EMI) und Verlustleistung 

� Sender begrenzen z.T. die Anstiegszeit der Signale (zu schnelle Signale stören die Umgebung, EMI) 

� Kann als Pegelwandler ('Level-Shifter') benutzt werden: i.A. VTT ≠ VDD 

� Empfänger vergleicht Signal mit einer Schwelle, die aus VTT erzeugt wird. Sie liegt >VTT/2, da der low- 

Pegel nicht ganz Null sind. 

� Busse bilden Wired-AND Funktion 

� Störabstand ist recht klein 

� VTT = 1.2V für GTL, VTT = 1.5V für GTLP (GTL ‚Plus‘, etwas höherer Störabstand) 

Sender 


VTT 

VTT 

R 

Vref 

2R 

Empfänger 

Differentieller 

Empfänger 

1.2V 

0.85V 

0.80V 

0.75V 

0.4V 

GND 

Pegel für 

VTT=1.2V 

VTT 

VIH Vref VIL V OL 


Single ended: 

Signalpegel 

� TTL Niedrige Low-Levels, Asymmetrische Treiberfähigkeit. Signale daher meist active low. 

Unbenutzte Eingänge mit Pullup auf VCC legen. 

� CMOS Rail-to-rail Ausgänge, Schwelle auf halber Versorgung. Symmetrische Ausgänge. 

Davon abweichend: Spezielle Familien mit Kompatibilität zu TTL 

� ECL Negative Spannungen von ~-0.85V und ~-1.75V. Auch PECL 

� GTL Open Drain Ausgang mit niedriger Terminierungsspannung. 

Kleiner Swing, High-Speed. 

Niedriger Störabstand 

Differentiell: 

� ECL negative Pegel. Auch PECL (5V) oder LVPECL (3.3V) 

Bis 10 Gbps ! 

� LVDS 1990 von National Semiconductor eingeführt. 

Treiber: +1.25V±175mV (d.h. 350mV Hub) 

Empfänger: Differenzverstärker mit Hysterese von 100mV. 

Hoher Common-Mode-Bereich 

Abschluß meist differentiell mit 100 oder 110Ω. 

Viele andere Varianten. 'Low Power'. Bis 2.5Gbps! 

� CML Nicht gut standardisiert. Meist Point-to-Point. 

Entsteht aus CML Logik, wenn Last in den Empfänger-IC verlagert wird. 

Low Swing. Sehr schnell. 

Externe Signalleitungen können auf konstanten Potential gehalten werden. 



Ausblick: LVDS Treiber 

� Zur Erzeugung eines LVDS Signals kann man einen Strom I 0 in unterschiedliche Richtungen durch einen 

Lastwiderstand R TRM schicken: 

in in 

in in 


in=1 in=0 

I 0 

R TRM 

R 0 

U high=U lo+I 0×R TRM 

U low=I 0×R 0 



Signalpegel 

Quelle: Texas Instruments 



Vergleich Geschwindigkeit / Treiberfähigkeit 



Entwicklung Logikfamilien 

Quelle: Texas Instruments 



'Glue Logik' 

CSP: 

- 1.35 × 0.85mm2 - 1.35 × 0.85mm2 - 0.5mm dick 

- bump ∅ = 170µm 

- auch bleifrei

Logikfamilien (4.2 MB)

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?