Deutsch - Rohde & Schwarz International

MOBILFUNK 

Funkmessplätze 

128 

Rate 

1 

Original speech signal (20 ms frame with 

160 samples, each sample with 14 bits) 

Data rate 

determination 

Rate 

1/2 

Pseudorandom 

vector 

generator 

RSeed* 

Random seed 

128 

Excitation 

codebook 

Rate 

1/4 

I* (Index) 

Input packet type 

and packet data 

Highpass filter / 

Hamming window 

Rate 

1/8 

Rate 1 

1/8 or 1/4 

Rate 1 

or 1/2 

G* (gain) 

Gs* (gain sign) 

Data 

unpacking 

LPC (Formant) 

analysis (20 ms frame 

with 160 samples) 

LPC coeffs 

Closed loop pitch search 

(5 ms subframe 


Excitation codebook 

search (1.25 ms subframe 


Pitch 

synthesis 

filter 

1/P(z) 

Important features: 

• Encoder output data rate = 266 bits/20 ms = 13,3 kbit/s 

• Compression rate = 160×14 bits/266 bits = 8,42 

LPC coeffs 

Vector quantization 

Interpolating LSP freqs 

for pitch/codebook 

search subframes 

LSP freqs → LPC coeffs 

Codebook gain G* (3 or 4 bits) 

Codebook gain sign Gs* (1 bit) 

Codebook index I* (7 bits) 

or random seed RSeed* (4 bits) 

b* (pitch gain) 

L* (pitch lag) 

Pitch 

pre-filter 

1/P'(z) 

LSPVs 

b'* & L* 

Gain 

control 

LSP freqs → LPC coeffs 

Interpolating LSP freqs 

for pitch/codebook 

search subframes 

Vector unquantization 

LPC coeffs → LSP freqs 

LSPVs (32 bits) 

Pitch gain b* (3 bits) 

Pitch lag L* (8 bits) 

LSPs 

Vector quantization 

Data packing 

Transmission packet data 

(264 bits + 2 reserved bits) 

BILD 1 Codierungsprozess mit LPC(Formant)-Analyse, Bestimmung der Datenrate, Pitch-Suche 

und Codebook-Suche am Beispiel des 13k Speech Coders. 

Formant (LPC) 

synthesis 

filter 

1/A(z) 

LPC coeffs 

Adaptive 

postfilter 

APF(z) 

Gain 

control 

Output 

synthesized 

speech 

BILD 2 Erzeugung des synthetisierten Sprachsignals durch Filterung des Codebook-Vektors mit 

dem Pitch-Synthese-Filter und dem Formant-Synthese-Filter. 

Sprachcodierung: der Ablauf 

Die Codierung geschieht grob in vier 

Schritten (BILD 1): 

◆ LPC-(Formant)-Analyse 

◆ Bestimmung der Datenrate 

◆ Pitch-Suche (auch als Long-Term-Predictor 

(LTP) bezeichnet) und 

◆ Codebook-Suche 

Im ersten Schritt erfolgt die LPC-Analyse 

mit dem Ziel, die optimalen Filterkoeffizienten 

zu finden. Ein Formant ist eine 

Resonanzfrequenz des menschlichen 

Vokaltraktes, erkennbar an einer Spitze 

im Kurzzeitspektrum. Jeder Frame des 

Eingangssignals (das in 20-ms-Frames 

unterteilt ist) durchläuft zuerst ein Hochpass- 

und ein Hamming-Fenster-Filter. 

Im zweiten Schritt wird für jeden Frame 

die Datenrate bestimmt. Hintergrundrauschen 

und Pausen werden mit 1/8-Rate, 

stimmlose Laute mit 1/4-Rate, stationäre, 

periodische und gut modellierte 

Frames mit 1/2-Rate, Frames mit Sprach- 

Übergängen, nicht periodische Frames 

und schlechter modellierbare Frames mit 

voller Rate übertragen. 

Der dritte Schritt ist die Pitch-Suche. 

Ein Pitch ist die Grundfrequenz periodischer 

Signalanteile in der menschlichen 

Stimme. Die Pitch-Suche wird auf Sub- 

Frame-Basis durchgeführt. 

Mit Hilfe der so bestimmten Parameter 

wird nun in der letzten Stufe aus 

einem sogenannten Codebook der 

Vektor ausgewählt, der das Eingangssignal 

am besten beschreibt und damit den 

gewichteten Fehler zwischen Eingangsund 

synthetisiertem Signal minimiert. 

Nach der Übertragung dieser Parameter 

(LPC-Filter- und Pitch-Filter-Koeffizienten, 

Codebook-Vektor) entsteht das synthetisierte 

Sprachsignal durch Filtern des 

Codebook-Vektors mit dem Pitch-Synthese-Filter 

und dem Formant-Synthese- 

Filter (BILD 2). 

Neues von Rohde&Schwarz 

26 

Heft 176 (2002/IV)

Vorherige Seite

Nächste Seite

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

Deutsch - Rohde & Schwarz International

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?