Deutsch - Rohde & Schwarz International
Deutsch - Rohde & Schwarz International
Deutsch - Rohde & Schwarz International
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
MOBILFUNK<br />
Funkmessplätze<br />
128<br />
Rate<br />
1<br />
Original speech signal (20 ms frame with<br />
160 samples, each sample with 14 bits)<br />
Data rate<br />
determination<br />
Rate<br />
1/2<br />
Pseudorandom<br />
vector<br />
generator<br />
RSeed*<br />
Random seed<br />
128<br />
Excitation<br />
codebook<br />
Rate<br />
1/4<br />
I* (Index)<br />
Input packet type<br />
and packet data<br />
Highpass filter /<br />
Hamming window<br />
Rate<br />
1/8<br />
Rate 1<br />
1/8 or 1/4<br />
Rate 1<br />
or 1/2<br />
G* (gain)<br />
Gs* (gain sign)<br />
Data<br />
unpacking<br />
LPC (Formant)<br />
analysis (20 ms frame<br />
with 160 samples)<br />
LPC coeffs<br />
Closed loop pitch search<br />
(5 ms subframe<br />
with 40 samples)<br />
Excitation codebook<br />
search (1.25 ms subframe<br />
with 10 samples)<br />
Pitch<br />
synthesis<br />
filter<br />
1/P(z)<br />
Important features:<br />
• Encoder output data rate = 266 bits/20 ms = 13,3 kbit/s<br />
• Compression rate = 160×14 bits/266 bits = 8,42<br />
LPC coeffs<br />
Vector quantization<br />
Interpolating LSP freqs<br />
for pitch/codebook<br />
search subframes<br />
LSP freqs → LPC coeffs<br />
Codebook gain G* (3 or 4 bits)<br />
Codebook gain sign Gs* (1 bit)<br />
Codebook index I* (7 bits)<br />
or random seed RSeed* (4 bits)<br />
b* (pitch gain)<br />
L* (pitch lag)<br />
Pitch<br />
pre-filter<br />
1/P'(z)<br />
LSPVs<br />
b'* & L*<br />
Gain<br />
control<br />
LSP freqs → LPC coeffs<br />
Interpolating LSP freqs<br />
for pitch/codebook<br />
search subframes<br />
Vector unquantization<br />
LPC coeffs → LSP freqs<br />
LSPVs (32 bits)<br />
Pitch gain b* (3 bits)<br />
Pitch lag L* (8 bits)<br />
LSPs<br />
Vector quantization<br />
Data packing<br />
Transmission packet data<br />
(264 bits + 2 reserved bits)<br />
BILD 1 Codierungsprozess mit LPC(Formant)-Analyse, Bestimmung der Datenrate, Pitch-Suche<br />
und Codebook-Suche am Beispiel des 13k Speech Coders.<br />
Formant (LPC)<br />
synthesis<br />
filter<br />
1/A(z)<br />
LPC coeffs<br />
Adaptive<br />
postfilter<br />
APF(z)<br />
Gain<br />
control<br />
Output<br />
synthesized<br />
speech<br />
BILD 2 Erzeugung des synthetisierten Sprachsignals durch Filterung des Codebook-Vektors mit<br />
dem Pitch-Synthese-Filter und dem Formant-Synthese-Filter.<br />
Sprachcodierung: der Ablauf<br />
Die Codierung geschieht grob in vier<br />
Schritten (BILD 1):<br />
◆ LPC-(Formant)-Analyse<br />
◆ Bestimmung der Datenrate<br />
◆ Pitch-Suche (auch als Long-Term-Predictor<br />
(LTP) bezeichnet) und<br />
◆ Codebook-Suche<br />
Im ersten Schritt erfolgt die LPC-Analyse<br />
mit dem Ziel, die optimalen Filterkoeffizienten<br />
zu finden. Ein Formant ist eine<br />
Resonanzfrequenz des menschlichen<br />
Vokaltraktes, erkennbar an einer Spitze<br />
im Kurzzeitspektrum. Jeder Frame des<br />
Eingangssignals (das in 20-ms-Frames<br />
unterteilt ist) durchläuft zuerst ein Hochpass-<br />
und ein Hamming-Fenster-Filter.<br />
Im zweiten Schritt wird für jeden Frame<br />
die Datenrate bestimmt. Hintergrundrauschen<br />
und Pausen werden mit 1/8-Rate,<br />
stimmlose Laute mit 1/4-Rate, stationäre,<br />
periodische und gut modellierte<br />
Frames mit 1/2-Rate, Frames mit Sprach-<br />
Übergängen, nicht periodische Frames<br />
und schlechter modellierbare Frames mit<br />
voller Rate übertragen.<br />
Der dritte Schritt ist die Pitch-Suche.<br />
Ein Pitch ist die Grundfrequenz periodischer<br />
Signalanteile in der menschlichen<br />
Stimme. Die Pitch-Suche wird auf Sub-<br />
Frame-Basis durchgeführt.<br />
Mit Hilfe der so bestimmten Parameter<br />
wird nun in der letzten Stufe aus<br />
einem sogenannten Codebook der<br />
Vektor ausgewählt, der das Eingangssignal<br />
am besten beschreibt und damit den<br />
gewichteten Fehler zwischen Eingangsund<br />
synthetisiertem Signal minimiert.<br />
Nach der Übertragung dieser Parameter<br />
(LPC-Filter- und Pitch-Filter-Koeffizienten,<br />
Codebook-Vektor) entsteht das synthetisierte<br />
Sprachsignal durch Filtern des<br />
Codebook-Vektors mit dem Pitch-Synthese-Filter<br />
und dem Formant-Synthese-<br />
Filter (BILD 2).<br />
Neues von <strong>Rohde</strong>&<strong>Schwarz</strong><br />
26<br />
Heft 176 (2002/IV)