23.02.2015 Views

ڷˉ ÔÓ Â øÔÎȉ ≠ ‰È‰ ÌÓ‡‰ ∫ÏÂ·Ó - אוניברסיטת בר אילן

ڷˉ ÔÓ Â øÔÎȉ ≠ ‰È‰ ÌÓ‡‰ ∫ÏÂ·Ó - אוניברסיטת בר אילן

ڷˉ ÔÓ Â øÔÎȉ ≠ ‰È‰ ÌÓ‡‰ ∫ÏÂ·Ó - אוניברסיטת בר אילן

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

˙È˙·ÏÓ ‰appleÈ·<br />

אפשר להגיע לדיוק גבוה יותר אם מפענחים הבעות לפי<br />

סרטי וידיאו ולא לפי תמונות בודדות,‏ מכיוון שתנועות הפנים<br />

מבהירות טוב יותר את מצב השרירים השולטים על ההבעה.‏<br />

כידוע,‏ גם בני-אדם מצליחים יותר בזיהוי הבעות של ‏"פנים<br />

חיים"‏ מאשר הבעות בתמונה.‏ המגבלה העיקרית בשיטה<br />

זו היא מהירות החישוב:‏ מכיוון שתמונה חדשה מופיעה<br />

כ-‏‎30‎ פעם בשנייה,‏ המצב האידאלי הוא זיהוי ההבעה תוך<br />

פרק זמן קרוב ל-‏‎1/30‎ של שנייה — פעולה ב"זמן אמיתי"‏<br />

.(real-time) המחקרים שהוזכרו לעיל,‏ באוניברסיטה<br />

הפוליטכנית של מדריד,‏ מצליחים להגיע למצב זה ולדיוק של<br />

89% בזיהוי,‏ גם כאשר הצילומים הם מאיכות נמוכה בגלל<br />

בעיות בתאורה ותזוזות מצלמה,‏ כפי שקורה לעתים קרובות<br />

ב"עולם האמיתי"‏ ‏(כלומר שלא בתנאי מעבדה).‏<br />

לאן יכולה יכולת זו להתפתח בעתיד?‏ לא כל בני-האדם<br />

מוכשרים באותה מידה בקריאת קולם ופניהם של אחרים,‏<br />

אבל פערים אלה עשויים להצטמצם בעזרת תוכנה מתאימה.‏<br />

בשלב שלאחר מכן,‏ עשויה התוכנה להצליח יותר מאשר<br />

המומחים הטובים ביותר לקריאת שפת גוף.‏ אין ספק שיש<br />

לכך ביקוש:‏ כבר לפחות עשר שנים אפשר לרכוש תוכנות<br />

לניתוח קול הטוענות ליכולת להחליט אם האדם שהמערכת<br />

מקשיבה לו דובר אמת או משקר,‏ אף שאמינותן של תוכנות<br />

אלו מוטלת בספק.‏ אם יכולות כאלו יגיעו לרמה גבוהה של<br />

אמינות וזמינות,‏ אפשר לדמיין אפילו את הטלפון הנייד<br />

שלנו,‏ בעזרת המצלמה והמיקרופון הקבועים בו,‏ מסמן לנו<br />

ברטט קל מתי בני-שיחנו משקרים,‏ מתרגשים,‏ מעוניינים או<br />

פוחדים.‏ גם מכשירי טלוויזיה יוכלו לסמן,‏ ליד ראשו של כל<br />

אדם הנראה בתמונה,‏ מה הוא מרגיש באותו רגע.‏ איך תיראה<br />

חברה אנושית שבה כל האנשים מצוידים בטכנולוגיה כזו?‏<br />

ËϘ‰ ÈappleÙÎ ¯Â„‰ ÈappleÙ<br />

בטור זה דיווחנו בעבר ‏("האח הגדול מזהה אותך",‏ ‏"גליליאו"‏<br />

108) על זיהוי אנשים לפי תמונותיהם ועל הפוטנציאל של<br />

טכנולוגיה זו לטוב ולרע.‏ מי שחושש — ובצדק — מהפגיעה<br />

בפרטיות היכולה להיווצר בשל מצלמות הנמצאות בכל מקום<br />

ומחוברות לתוכנת זיהוי פנים,‏ ודאי לא ישמח לשמוע על<br />

רעיונות חדשים המתאפשרים הודות לזיהוי הבעות.‏ למשל,‏<br />

המוכר בחנות יוכל לקבל אינדיקציה עד כמה אנו מעוניינים<br />

במוצר שאותו אנו בוחנים כרגע,‏ אפילו כאשר הוא מרוחק<br />

מאיתנו,‏ ולאחר מכן לנצל זאת כדי להצליח יותר במשא ומתן או<br />

כדי להציע מוצרים נוספים.‏ נואמים עשויים להיעזר במצלמות<br />

המכוונות אל הקהל ומספקות משוב מיידי לגבי תגובות הקהל<br />

לדבריהם.‏ חברות הכבלים יוכלו לקבל מהמשפחות המשתתפות<br />

במדידת המדרוג ‏(רייטינג)‏ מידע רב יותר — לא רק כמה זמן צפו<br />

בכל ערוץ,‏ אלא גם מה הרגישו בכל שנייה במשך השידור — שלא<br />

לדבר על מדידת התגובה לפרסומות...‏<br />

מצד אחר,‏ אפשר גם לחשוב על שימושים חיוביים יותר,‏ כמו<br />

תוכנה המגלה מתי הנהג עומד להירדם ‏(קיימות כבר מערכות<br />

כאלה,‏ המבוססות למשל על תנועות העיניים,‏ אבל ייתכן<br />

שפענוח תנועות כל הפרצוף יהיה פשוט ואמין יותר).‏<br />

הרעיונות שתוארו עד כה,‏ חיוביים או שליליים ככל שיהיו,‏<br />

מתייחסים למצבים שבהם איננו מנהלים תקשורת דו-סטרית<br />

‏(או לפחות איננו יודעים שהצד האחר קולט את הרגשות<br />

שאנו מביעים).‏ אם נתייחס לתפקיד העיקרי של הבעות<br />

פנים — העברת מסרים כערוץ נוסף של התקשורת שבה אנו<br />

נמצאים כרגע בידיעתנו וברצוננו — נמצא מגוון רחב ומעודד<br />

יותר של שימושים.‏<br />

נתייחס תחילה לתקשורת בין אדם למחשב.‏ גם עבור<br />

הפעולות המורכבות ביותר שעבורן אנו נעזרים בתוכנה,‏<br />

אנו מוגבלים בהעברת הפקודות למחשב על-ידי הממשק:‏<br />

אנו יכולים להשתמש בכמאה המקשים שעל לוח המקשים<br />

ובתנועות של העכבר — קדימה ואחורה או ימינה ושמאלה.‏<br />

בדרך-כלל כל פעולה כזו באה לחוד,‏ למעט צירופים של מקשים<br />

מיוחדים ‏(כמו (shift עם מקשים אחרים על לוח המקשים או<br />

על העכבר.‏ תקשורת זו שונה מאוד מתקשורת רב-ערוצית,‏<br />

שבה קורים דברים רבים במקביל:‏ לצד המילים שאנו אומרים<br />

באות גם תנועות הידיים,‏ הבעות הפנים,‏ טון הדיבור,‏ מהירות<br />

הדיבור,‏ תנוחת הגוף,‏ קשר עין ועוד.‏ אם יעמדו לרשותנו גם<br />

ערוצים אלו,‏ נוכל להשתמש בהם כדי לשפר ולהאיץ כמעט כל<br />

אינטראקציה עם המחשב.‏<br />

ניקח למשל חיפוש באינטרנט:‏ לאחר שקיבלנו את רשימת<br />

∑<br />

090<br />

‡ÈÏÈÏ‚<br />

ÈappleÂÈ<br />

≤∞∞∏

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!