ש×פ×ר ×××× ×¤×¨×××¨× ×ק×××× ××ת×ת ש××¢ ×קצ××× × ××××× - SIPL - ×××× ×××
ש×פ×ר ×××× ×¤×¨×××¨× ×ק×××× ××ת×ת ש××¢ ×קצ××× × ××××× - SIPL - ×××× ×××
ש×פ×ר ×××× ×¤×¨×××¨× ×ק×××× ××ת×ת ש××¢ ×קצ××× × ××××× - SIPL - ×××× ×××
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
3.4.2 מודל לחישוב סף המיסוך<br />
בתקני MPEG<br />
לקידוד שמע משתמשים ב-<br />
32 מסננים<br />
banks) (filter המפרידים את האות ל-<br />
32<br />
פסים שווים בגודלם במישור התדר [5]. כל תחום משודר באמצעות מספר סיביות שונה, בהתאם<br />
למודל הפסיכואקוסטי.<br />
חלוקת תחום התדר בצורה שווה היא בעייתית כיוון שהייצוג שונה לגמרי מהתחומים הקריטיים,<br />
שהיא החלוקה האמיתית של האוזן.<br />
רוחב הסרט של התחום הקריטי גדל עם עליית התדר המרכזי בתחום, לכן צריך לבחור קבוצת<br />
מסננים<br />
(filter banks)<br />
בעלי רוחב סרט השקול לרוחב הקטן ביותר של התחומים הקריטיים (סדר<br />
גודל של ,(100Hz ואז הרזולוציה תהיה מספיק טובה.<br />
המודל הפסיכואקוסטי מבוסס על חישוב יחס אות למיסוך (SMR) בכל אחד מ- 32 התחומים.<br />
המודל מחשב את עוצמת הספקטרום של האות ע"י .FFT (תיאור מפורט בהמשך הפרק).<br />
מחפשים בספקטרום מרכיבים טונליים ומרכיבי רעש. מחשבים את סף המיסוך של כל מרכיב<br />
לבדו. ובסוף מחברים לינארית את כל הספים ביחד עם סף המיסוך המוחלט לקבלת סף מיסוך<br />
גלובלי. מרכיבי מיסוך בתדר מסויים מוזנחים אם רמתם מתחת לרמת סף המיסוך המוחלט<br />
(בשקט).<br />
המודל מורכב מחמישה שלבים<br />
:[21]<br />
.1<br />
ניתוח ספקטרלי והמרה ל .SPL<br />
המטרה של שלב זה היא ייצוג מרכיבים ספקטרליים ע"י רמות .SPL<br />
תחילה, מנרמלים את דגימות הכניסה,<br />
,s(n)<br />
באורך N (של<br />
,FFT<br />
ובמספר הסיביות המשתמשים לייצור הדגימה. הנירמול מתואר ע"י:<br />
ערך טיפוסי הוא<br />
512 דגמים)<br />
s(<br />
n)<br />
x( n)<br />
=<br />
b−1<br />
N ⋅ (2 )<br />
(3.4)<br />
הנירמול מביא לעוצמת ספקטרום מקסימלית של 0. dB<br />
האות המנורמל מחולק לקטעים ע"י הכפלה בחלון Hann (מסומן ע"י<br />
ומבוצעת המרה לתדר, לפי המשוואה:<br />
(w(n)<br />
P(<br />
k)<br />
= PN + 10 log<br />
N −1<br />
10 ∑ w(<br />
n)<br />
x(<br />
n)<br />
n=<br />
0<br />
e<br />
2<br />
− j(2πkn<br />
/ N )<br />
N<br />
0 ≤ k ≤<br />
(3.5)<br />
2<br />
כאשר PN נקבע ל- .90.302dB<br />
דוגמה לאות שמע, שעבר את התהליך ומיוצג ברמות ,SPL מופיע באיור<br />
.3.6<br />
- 26 -