23.02.2015 Views

ÌȯȄ‡ ÌȉÂχ ¨‰Ú˙Ù‰ ‰Ú˙Ù‰ ø‰Ê ˙‡ ·˙Î ÈÓ - אוניברסיטת בר אילן

ÌȯȄ‡ ÌȉÂχ ¨‰Ú˙Ù‰ ‰Ú˙Ù‰ ø‰Ê ˙‡ ·˙Î ÈÓ - אוניברסיטת בר אילן

ÌȯȄ‡ ÌȉÂχ ¨‰Ú˙Ù‰ ‰Ú˙Ù‰ ø‰Ê ˙‡ ·˙Î ÈÓ - אוניברסיטת בר אילן

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

ÔÏȇ–¯· ˙ËÈÒ¯·Èapple‡ ȯ˜ÁÓÓ<br />

º º<br />

”… שמעתי פעם את סברתך שקשה לאדם להשתמש<br />

בחפץ כלשהו יום-יום מבלי שיטביע עליו את חותם אישיותו<br />

המיוחדת כך שכל משקיף מאומן יוכל לגלותה.‏ הנה,‏ יש לי<br />

כאן שעון שהגיע לא מכבר לרשותי.‏ התואיל בטובך להביע<br />

את דעתך באוזניי על אופיו והרגליו של בעליו האחרון?"‏<br />

מסרתי להולמס את השעון,‏ והשתעשעתי בלִבי במחשבה<br />

שאת המבחן הזה אי-אפשר לעבור.‏ התכוונתי להוכיחו על<br />

פניו על נטייתו החוזרת ונשנית לקבוע מסמרות בעקשנות<br />

רברבנית.‏ הוא איזן את השעון על כף ידו,‏ הציץ בלוח<br />

המחוגים,‏ פתח את המכסה האחורי ובדק את המנגנון,‏<br />

תחילה בעין בלתי מזוינת ואחר כך בזכוכית מגדלת רבת<br />

עוצמה.‏ בקושי יכולתי להתאפק מלחייך למראה פניו<br />

הנפולות,‏ ואז סגר את המכסה בנקישה והחזיר לי את השעון.‏<br />

‏"אין לי כמעט שום נתונים,"‏ ציין.‏ ‏"השעון הזה נוקה<br />

באחרונה,‏ ולכן חסרות לי כמה עובדות משמעותיות ביותר."‏<br />

‏"אך למרות שאיננה משביעת רצון,‏ לא הייתה<br />

החקירה שלי עקרה לגמרי,"‏ הוסיף והביט בתקרה<br />

במבט חולמני ומצועף.‏ ‏"תקן אותי אם אני טועה.‏<br />

השעון היה שייך לאחיך הבכור,‏ שירש אותו מאביך."‏<br />

‏"נכון,‏ עד עתה,"‏ אמרתי.‏ ‏"עוד משהו?"‏<br />

‏"הוא היה אדם בלתי-מסודר,‏ מבולבל וחסר זהירות.‏ מצבו<br />

הכלכלי היה טוב בתחילה,‏ אך הוא החמיץ את ההזדמנות,‏<br />

חי בעוני כשמדי פעם הוא זוכה לתקופות קצרות של שגשוג,‏<br />

אך לבסוף החל לשתות לשכרה ומת.‏ זה כל מה שהצלחתי<br />

לברר..."‏<br />

מתוך:‏ חותם הארבעה,‏ ארתור קונן דויל.‏ מאנגלית:‏ אורי<br />

בלסם,‏ זמורה ביתן,‏ 1983<br />

יותר ממאה שנים חלפו מאז כבש הבלש הספרותי המפורסם<br />

שרלוק הולמס את לבם של אנשי לונדון והצליח ללכוד לא<br />

מעט פושעים בזכות יכולותיו האנליטיות,‏ הלוגיקה ומוחו זריז<br />

המחשבה.‏ למרות פערי הזמן אנו ממשיכים להתפעל מהיכולת<br />

הבלתי רגילה של הבלש האגדי להסיק בפרטי פרטים מסקנות<br />

על אופיים של בני האדם.‏<br />

דמיינו כי יש בידכם יש תוכנת מחשב בעלת יכולות לא<br />

פחות טובות מאלה של הבלש המפורסם.‏ לתוכנה זאת די<br />

בהרצת פרי יצירתו של מחבר לא ידוע ולקבל,‏ בעזרת סדרת<br />

פעולות מתאימות,‏ תיאור מפורט ומהימן של מחבר הטקסט<br />

‏(ארץ מוצא,‏ מין,‏ גיל,‏ מאפייני אופי ותרבות).‏<br />

תוכנה כזו יכולה לענות על צרכים של קהל מגוון:‏<br />

מהמשטרה,‏ שיכולה להיעזר בתוכנה לשם חשיפת עקבותיהם<br />

של פושעים ברשת האינטרנט,‏ דרך חשיפת מאפייניהם של<br />

חברים בקבוצות קיצוניות המפעילות אתרים ברשת ועד<br />

חוקרי ספרות המתלבטים בזהות מחברו של הטקסט.‏ כמו<br />

כן יכולה השיטה לסייע בבדיקת כתבי עת עתיקים,‏ כאשר<br />

אין בידינו די מידע:‏ אם למשל נמצאו באתר ארכיאולוגי<br />

מספר מגילות,‏ ניתוח כזה יכול להראות האם כולן נכתבו<br />

בידי אותו מחבר.‏<br />

והנה,‏ פרופ'‏ משה קופל וד"ר יהונתן שלר מאוניברסיטת<br />

בר-אילן,‏ ועמיתיהם פרופ'‏ שלמה ארגמון מהמכון לטכנולוגיה<br />

בשיקגו ופרופ'‏ ג'ימס פנבקר (Pennebaker) מאוניברסיטת<br />

טקסס מצאו נוסחה,‏ שעשויה לתת תשובה בתחום זיהוי<br />

מאפייני המחבר על סמך ניתוח טקסט שנכתב על ידו.‏ התוכנה<br />

שפיתחו קופל,‏ שלר ועמיתיהם מזהה מאפיינים סגנוניים של<br />

הכותב על פי ניתוח הטקסט,‏ בין אם הוא טקסט ספרותי ובין<br />

אם הוא תגובה באינטרנט או כל מסמך כתוב.‏<br />

קופל ושלר אינם עוסקים רק בהבדלים מגדריים בין<br />

כותבים:‏ הם שיכללו את שיטות המחקר שיאפשרו לזהות<br />

את ‏"טביעת האצבע"‏ הספרותית עד לרמת דיוק המאפשרת<br />

להבחין בין כותב אחד למשנהו.‏ באמצעות התוכנה שפיתחו<br />

אפשר לזהות במידה גבוהה את מגדר הכותב ,(gender) את<br />

גילו ושפת האם שלו,‏ וכל זה על ידי ניתוח טקסט שכתב<br />

באנגלית.‏ בנוסף,‏ הניתוח מאפשר לקבוע האם טקסטים<br />

שונים שייכים לאותו מחבר.‏<br />

‰¯Â˙ ‡ˆ˙ ‚ÂÏ·‰Ó<br />

אחד המקורות לטקסטים שבהם השתמשו קופל ושלר<br />

לצרכי המחקר ופיתוח התוכנה,‏ הוא עולם הבלוגים ,(Blogs)<br />

יומנים אישיים המתפרסמים ברשת.‏ הבלוגים זוכים<br />

לפופולריות רבה ומהווים מאגר של מאות אלפי טקסטים,‏<br />

שניתן לנתחם ולדלות מהם מידע על אופי המחברים.‏ כמות<br />

זו טקסטים מאפשרת להרחיב ולשדרג את בסיס הנתונים של<br />

תוכנת המחשב.‏<br />

היסטוריה של זיהוי פרופיל המחבר<br />

הכל התחיל בשנות השישים המוקדמות של מאה ה-‏ 20,<br />

כאשר פרדריק מוסטלר (Mosteller) מאוניברסיטת הרווארד<br />

ודוויד ואלאס (Wallace) מאוניברסיטת שיקגו פרסמו עבודה<br />

שהפכה לפריצת דרך בתחום זיהוי אוטומטי של פרופיל מחבר,‏<br />

המבוסס על תוכנת מחשב ‏(ראו הפניה למטה).‏ שני החוקרים<br />

עבדו על 12 מאמרים מתוך ‏"כתבי הפדרליסט"‏ במטרה לגלות<br />

את זהות המחברים ‏(ראו מסגרת).‏ הם השתמשו באלגוריתם<br />

שביצע ניתוח סטטיסטי של שפת המאמרים וחישוב של<br />

45<br />

‡ÈÏÈÏ‚<br />

¯·Ó·Âapple<br />

≤∞∞∏

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!