31.03.2014 Views

שיפור מודל פרמטרי לקידוד אותות שמע בקצבים נמוכים - SIPL - הטכניון

שיפור מודל פרמטרי לקידוד אותות שמע בקצבים נמוכים - SIPL - הטכניון

שיפור מודל פרמטרי לקידוד אותות שמע בקצבים נמוכים - SIPL - הטכניון

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

3.4.2 מודל לחישוב סף המיסוך<br />

בתקני MPEG<br />

לקידוד שמע משתמשים ב-‏<br />

32 מסננים<br />

banks) (filter המפרידים את האות ל-‏<br />

32<br />

פסים שווים בגודלם במישור התדר [5]. כל תחום משודר באמצעות מספר סיביות שונה,‏ בהתאם<br />

למודל הפסיכואקוסטי.‏<br />

חלוקת תחום התדר בצורה שווה היא בעייתית כיוון שהייצוג שונה לגמרי מהתחומים הקריטיים,‏<br />

שהיא החלוקה האמיתית של האוזן.‏<br />

רוחב הסרט של התחום הקריטי גדל עם עליית התדר המרכזי בתחום,‏ לכן צריך לבחור קבוצת<br />

מסננים<br />

(filter banks)<br />

בעלי רוחב סרט השקול לרוחב הקטן ביותר של התחומים הקריטיים ‏(סדר<br />

גודל של ,(100Hz ואז הרזולוציה תהיה מספיק טובה.‏<br />

המודל הפסיכואקוסטי מבוסס על חישוב יחס אות למיסוך (SMR) בכל אחד מ-‏ 32 התחומים.‏<br />

המודל מחשב את עוצמת הספקטרום של האות ע"י .FFT ‏(תיאור מפורט בהמשך הפרק).‏<br />

מחפשים בספקטרום מרכיבים טונליים ומרכיבי רעש.‏ מחשבים את סף המיסוך של כל מרכיב<br />

לבדו.‏ ובסוף מחברים לינארית את כל הספים ביחד עם סף המיסוך המוחלט לקבלת סף מיסוך<br />

גלובלי.‏ מרכיבי מיסוך בתדר מסויים מוזנחים אם רמתם מתחת לרמת סף המיסוך המוחלט<br />

‏(בשקט).‏<br />

המודל מורכב מחמישה שלבים<br />

:[21]<br />

.1<br />

ניתוח ספקטרלי והמרה ל .SPL<br />

המטרה של שלב זה היא ייצוג מרכיבים ספקטרליים ע"י רמות .SPL<br />

תחילה,‏ מנרמלים את דגימות הכניסה,‏<br />

,s(n)<br />

באורך N ‏(של<br />

,FFT<br />

ובמספר הסיביות המשתמשים לייצור הדגימה.‏ הנירמול מתואר ע"י:‏<br />

ערך טיפוסי הוא<br />

512 דגמים)‏<br />

s(<br />

n)<br />

x( n)<br />

=<br />

b−1<br />

N ⋅ (2 )<br />

(3.4)<br />

הנירמול מביא לעוצמת ספקטרום מקסימלית של 0. dB<br />

האות המנורמל מחולק לקטעים ע"י הכפלה בחלון Hann ‏(מסומן ע"י<br />

ומבוצעת המרה לתדר,‏ לפי המשוואה:‏<br />

(w(n)<br />

P(<br />

k)<br />

= PN + 10 log<br />

N −1<br />

10 ∑ w(<br />

n)<br />

x(<br />

n)<br />

n=<br />

0<br />

e<br />

2<br />

− j(2πkn<br />

/ N )<br />

N<br />

0 ≤ k ≤<br />

(3.5)<br />

2<br />

כאשר PN נקבע ל-‏ .90.302dB<br />

דוגמה לאות שמע,‏ שעבר את התהליך ומיוצג ברמות ,SPL מופיע באיור<br />

.3.6<br />

- 26 -

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!