ש×פ×ר ×××× ×¤×¨×××¨× ×ק×××× ××ת×ת ש××¢ ×קצ××× × ××××× - SIPL - ×××× ×××
ש×פ×ר ×××× ×¤×¨×××¨× ×ק×××× ××ת×ת ש××¢ ×קצ××× × ××××× - SIPL - ×××× ×××
ש×פ×ר ×××× ×¤×¨×××¨× ×ק×××× ××ת×ת ש××¢ ×קצ××× × ××××× - SIPL - ×××× ×××
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
תקציר<br />
כשמדברים על פיתוח יישומי מולטימדיה, תמיד עולות דרישות חדשות לקידוד שמע בקצבים<br />
נמוכים מאוד. יעילות קידוד גבוהה נדרשת על מנת להתמודד עם בעיית רוחב פס מוגבל של ערוצי<br />
שידור ונועדה להתמודד עם בעיית משאב זיכרון מוגבל עבור יישומי אחסנה.<br />
קיימים כיום סטנדרטים שונים לדחיסת שמע והנפוץ שבהם הוא ה-<br />
השמע המשוחזר נשמעת טוב רק בקצבים של<br />
.mp3<br />
128kbps<br />
,mpeg4-audio<br />
עפ"י שיטה זו אות<br />
ומעלה. שיטה מתקדמת יותר היא<br />
הכוללת מספר גירסאות שמטרתן לעבוד בקצבים נמוכים עוד יותר, אך איכות<br />
אות השמע יורדת.<br />
כל השיטות לדחיסה בקצבים הנמוכים מנצלות את תכונת המיסוך של השמיעה האנושית, ובכך<br />
מונעות קידוד מידע שממילא לא יישמע לאוזן. השימוש במיסוך הוא מהגורמים החשובים<br />
בפעולת הדחיסה.<br />
מטרתנו במחקר זה היא לקודד אותות שמע בקצב נמוך של 16kbps ובנקודת עבודה זו לשפר את<br />
איכות השמע לרמה שתישמע נעימה לאוזן. דחיסה זו היא עבור אותות שמע (קול ומוסיקה)<br />
הדגומים בקצב<br />
,16KHz כלומר<br />
עם סיבית אחת לדגם.<br />
במחקר נתמקד במודל פרמטרי הנקרא<br />
(גירסא של<br />
Harmonic Individual Lines and Noise - HILN<br />
.(mpeg4-audio<br />
מודל זה מבוסס על הפרדת האות לשלושה מרכיבים עיקריים:<br />
סינוסים בדידים, הרמוניות ורעש. כל מרכיב מתואר ע"י מודל פרמטרי מתאים. מודל ה-HILN<br />
פותח בשנים האחרונות אך נחקר עדיין.<br />
במהלך סקר ספרות מכין שבוצע נמצאו מספר חסרונות של השיטה, הגורמות לירידה באיכות,<br />
כגון אי העברת מידע על פאזות האותות ומציאת תדר<br />
יסודי (pitch)<br />
יחיד בלבד באותות המכילים<br />
מספר תדרים יסודיים. בנוסף להתמודדות בבעיות אלו, יבחנו רעיונות נוספים לשיפור איכות אות<br />
השמע המשוחזר, כמו התאמה טובה יותר של המיסוך למודל, ייצוג אמפליטודות ההרמוניות<br />
בצורה יעילה יותר ופיתוח שיטה להפרדת תדרים קרובים.<br />
היכולת להפריד תדרים סמוכים, מאפשרת מיצוי טוב יותר של המרכיבים הטונליים באות השמע<br />
וגורמת לאיכות שמע טובה יותר. בתהליך מיצוי המרכיבים הטונליים מפיקים סינוסים רבים.<br />
קידוד כל סינוס בנפרד צורך מספר גדול של סיביות, לכן, השימוש במספר תדרים יסודיים גורם<br />
לשיפור הקידוד ומאפשר שידור של יותר סינוסים.<br />
קידוד יעיל של האמפליטודות לא פחות חשוב מקידוד התדרים. האמפליטודות מיוצגות בעזרת<br />
מעטפת ספקטרלית, העוברת בקרבת האמפליטודות. בעבודה זו מוצגים מספר שיפורים ביצירת<br />
המעטפת, הגורמים להקטנת השגיאה בייצוג האמפליטודות. השיפורים כוללים, מספר משתנה של<br />
מקדמים לייצוג המעטפת, מודל איטרטיבי לחישוב המעטפת, צמצום התחום הדינמי של<br />
- 1 -