ÃïÃââ¡ ÃÃâ°ÃÃ⡠¨â°ÃËÃâ° â°ÃËÃⰠøâ°Ã Ë⡠·Ëà Ãà - ××× ××רס××ת ×ר ××××
ÃïÃââ¡ ÃÃâ°ÃÃ⡠¨â°ÃËÃâ° â°ÃËÃⰠøâ°Ã Ë⡠·Ëà Ãà - ××× ××רס××ת ×ר ××××
ÃïÃââ¡ ÃÃâ°ÃÃ⡠¨â°ÃËÃâ° â°ÃËÃⰠøâ°Ã Ë⡠·Ëà Ãà - ××× ××רס××ת ×ר ××××
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
ÔÏȇ–¯· ˙ËÈÒ¯·Èapple‡ ȯ˜ÁÓÓ<br />
º º<br />
”… שמעתי פעם את סברתך שקשה לאדם להשתמש<br />
בחפץ כלשהו יום-יום מבלי שיטביע עליו את חותם אישיותו<br />
המיוחדת כך שכל משקיף מאומן יוכל לגלותה. הנה, יש לי<br />
כאן שעון שהגיע לא מכבר לרשותי. התואיל בטובך להביע<br />
את דעתך באוזניי על אופיו והרגליו של בעליו האחרון?"<br />
מסרתי להולמס את השעון, והשתעשעתי בלִבי במחשבה<br />
שאת המבחן הזה אי-אפשר לעבור. התכוונתי להוכיחו על<br />
פניו על נטייתו החוזרת ונשנית לקבוע מסמרות בעקשנות<br />
רברבנית. הוא איזן את השעון על כף ידו, הציץ בלוח<br />
המחוגים, פתח את המכסה האחורי ובדק את המנגנון,<br />
תחילה בעין בלתי מזוינת ואחר כך בזכוכית מגדלת רבת<br />
עוצמה. בקושי יכולתי להתאפק מלחייך למראה פניו<br />
הנפולות, ואז סגר את המכסה בנקישה והחזיר לי את השעון.<br />
"אין לי כמעט שום נתונים," ציין. "השעון הזה נוקה<br />
באחרונה, ולכן חסרות לי כמה עובדות משמעותיות ביותר."<br />
"אך למרות שאיננה משביעת רצון, לא הייתה<br />
החקירה שלי עקרה לגמרי," הוסיף והביט בתקרה<br />
במבט חולמני ומצועף. "תקן אותי אם אני טועה.<br />
השעון היה שייך לאחיך הבכור, שירש אותו מאביך."<br />
"נכון, עד עתה," אמרתי. "עוד משהו?"<br />
"הוא היה אדם בלתי-מסודר, מבולבל וחסר זהירות. מצבו<br />
הכלכלי היה טוב בתחילה, אך הוא החמיץ את ההזדמנות,<br />
חי בעוני כשמדי פעם הוא זוכה לתקופות קצרות של שגשוג,<br />
אך לבסוף החל לשתות לשכרה ומת. זה כל מה שהצלחתי<br />
לברר..."<br />
מתוך: חותם הארבעה, ארתור קונן דויל. מאנגלית: אורי<br />
בלסם, זמורה ביתן, 1983<br />
יותר ממאה שנים חלפו מאז כבש הבלש הספרותי המפורסם<br />
שרלוק הולמס את לבם של אנשי לונדון והצליח ללכוד לא<br />
מעט פושעים בזכות יכולותיו האנליטיות, הלוגיקה ומוחו זריז<br />
המחשבה. למרות פערי הזמן אנו ממשיכים להתפעל מהיכולת<br />
הבלתי רגילה של הבלש האגדי להסיק בפרטי פרטים מסקנות<br />
על אופיים של בני האדם.<br />
דמיינו כי יש בידכם יש תוכנת מחשב בעלת יכולות לא<br />
פחות טובות מאלה של הבלש המפורסם. לתוכנה זאת די<br />
בהרצת פרי יצירתו של מחבר לא ידוע ולקבל, בעזרת סדרת<br />
פעולות מתאימות, תיאור מפורט ומהימן של מחבר הטקסט<br />
(ארץ מוצא, מין, גיל, מאפייני אופי ותרבות).<br />
תוכנה כזו יכולה לענות על צרכים של קהל מגוון:<br />
מהמשטרה, שיכולה להיעזר בתוכנה לשם חשיפת עקבותיהם<br />
של פושעים ברשת האינטרנט, דרך חשיפת מאפייניהם של<br />
חברים בקבוצות קיצוניות המפעילות אתרים ברשת ועד<br />
חוקרי ספרות המתלבטים בזהות מחברו של הטקסט. כמו<br />
כן יכולה השיטה לסייע בבדיקת כתבי עת עתיקים, כאשר<br />
אין בידינו די מידע: אם למשל נמצאו באתר ארכיאולוגי<br />
מספר מגילות, ניתוח כזה יכול להראות האם כולן נכתבו<br />
בידי אותו מחבר.<br />
והנה, פרופ' משה קופל וד"ר יהונתן שלר מאוניברסיטת<br />
בר-אילן, ועמיתיהם פרופ' שלמה ארגמון מהמכון לטכנולוגיה<br />
בשיקגו ופרופ' ג'ימס פנבקר (Pennebaker) מאוניברסיטת<br />
טקסס מצאו נוסחה, שעשויה לתת תשובה בתחום זיהוי<br />
מאפייני המחבר על סמך ניתוח טקסט שנכתב על ידו. התוכנה<br />
שפיתחו קופל, שלר ועמיתיהם מזהה מאפיינים סגנוניים של<br />
הכותב על פי ניתוח הטקסט, בין אם הוא טקסט ספרותי ובין<br />
אם הוא תגובה באינטרנט או כל מסמך כתוב.<br />
קופל ושלר אינם עוסקים רק בהבדלים מגדריים בין<br />
כותבים: הם שיכללו את שיטות המחקר שיאפשרו לזהות<br />
את "טביעת האצבע" הספרותית עד לרמת דיוק המאפשרת<br />
להבחין בין כותב אחד למשנהו. באמצעות התוכנה שפיתחו<br />
אפשר לזהות במידה גבוהה את מגדר הכותב ,(gender) את<br />
גילו ושפת האם שלו, וכל זה על ידי ניתוח טקסט שכתב<br />
באנגלית. בנוסף, הניתוח מאפשר לקבוע האם טקסטים<br />
שונים שייכים לאותו מחבר.<br />
‰¯Â˙ ‡ˆ˙ ‚ÂÏ·‰Ó<br />
אחד המקורות לטקסטים שבהם השתמשו קופל ושלר<br />
לצרכי המחקר ופיתוח התוכנה, הוא עולם הבלוגים ,(Blogs)<br />
יומנים אישיים המתפרסמים ברשת. הבלוגים זוכים<br />
לפופולריות רבה ומהווים מאגר של מאות אלפי טקסטים,<br />
שניתן לנתחם ולדלות מהם מידע על אופי המחברים. כמות<br />
זו טקסטים מאפשרת להרחיב ולשדרג את בסיס הנתונים של<br />
תוכנת המחשב.<br />
היסטוריה של זיהוי פרופיל המחבר<br />
הכל התחיל בשנות השישים המוקדמות של מאה ה- 20,<br />
כאשר פרדריק מוסטלר (Mosteller) מאוניברסיטת הרווארד<br />
ודוויד ואלאס (Wallace) מאוניברסיטת שיקגו פרסמו עבודה<br />
שהפכה לפריצת דרך בתחום זיהוי אוטומטי של פרופיל מחבר,<br />
המבוסס על תוכנת מחשב (ראו הפניה למטה). שני החוקרים<br />
עבדו על 12 מאמרים מתוך "כתבי הפדרליסט" במטרה לגלות<br />
את זהות המחברים (ראו מסגרת). הם השתמשו באלגוריתם<br />
שביצע ניתוח סטטיסטי של שפת המאמרים וחישוב של<br />
45<br />
‡ÈÏÈÏ‚<br />
¯·Ó·Âapple<br />
≤∞∞∏