ÃïÃââ¡ ÃÃâ°ÃÃ⡠¨â°ÃËÃâ° â°ÃËÃⰠøâ°Ã Ë⡠·Ëà Ãà - ××× ××רס××ת ×ר ××××
ÃïÃââ¡ ÃÃâ°ÃÃ⡠¨â°ÃËÃâ° â°ÃËÃⰠøâ°Ã Ë⡠·Ëà Ãà - ××× ××רס××ת ×ר ××××
ÃïÃââ¡ ÃÃâ°ÃÃ⡠¨â°ÃËÃâ° â°ÃËÃⰠøâ°Ã Ë⡠·Ëà Ãà - ××× ××רס××ת ×ר ××××
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
ÔÏȇ–¯· ˙ËÈÒ¯·Èapple‡ ȯ˜ÁÓÓ<br />
ÔÏȇ–¯· ˙ËÈÒ¯·Èapple‡ ȯ˜ÁÓÓ<br />
º º<br />
øÊÂapple‚‰ ¯ÙÒ‰ ˙‡ ·˙Î ÈÓ<br />
·˘ÁÓ‰ ˙appleÎÂ˙ ˙ÂÚˆÓ‡· ‰¯˙Ùapple˘ ˙ÂÓÂÏÚ˙‰ ˙Á‡<br />
≠˘È‡ Ô·¢‰ ‰appleÂÎÓ‰ ¨ÌÈÈÁ ÛÒÂÈ ·¯‰ Ï˘ ÂÈ·˙η ‰˜ÒÚ<br />
ÈÙÏ ÆÌÈapple˘ ±∞∞ ≠Î ÈappleÙÏ „„‚·· È˘‡¯‰ ·¯Î Ô‰È΢ ¨¢ÈÁ<br />
ÏÚ ÆÚÂ„È ‡Ï ¯·ÁÓ˘ ¨ÊÂapple‚ ¯ÙÒ ‡ˆÓ ‡Â‰ ¨·¯‰ ˙appleÚË<br />
¯ÙÒ‰ ¨˙ÈÏ‚˙‰ ˙ÂÈ¯Â˜Ó ˙‡ ÍÈ¯Ù‰Ï Â‡ ÁÈÎÂ‰Ï ˙appleÓ<br />
˜„·apple ¢ÈÁ≠˘È‡ Ô·¢‰ Ï˘ ÌÈËÒ˜Ë‰Ó „Á‡Â ÊÂapple‚‰<br />
Èapple˘˘ ÍÎ ÏÚ Â„ÈÚ‰ ˙‡ˆÂ˙‰ ƉappleÎÂ˙‰ ˙¯ÊÚ· ÏÈ·˜Ó·<br />
Æ Æ Æ¯·ÁÓ Â˙‡ Ï˘ Â˙¯ÈˆÈ ȯ٠̉ ÌȯÙÒ‰<br />
של מילים, ביטויים וצירופי לשון ספציפיים במסמכי<br />
האימון, ומפעילה שיטות של למידת מכונה כדי לבנות<br />
נוסחה המסווגת כל אחד ממסמכי האימון לקבוצת<br />
שייכות. אותה נוסחה משמשת מודל חיזוי לניתוח<br />
טקסטים חדשים ולסיווגם (איור 1).<br />
לשם בדיקת מידת הדיוק של מודל החיזוי הריצו קופל ושלר<br />
את תוכנת הזיהוי על טקסטים בעל מאפייני מחבר ידועים,<br />
שכמובן לא שימשו לבניית המודל (להלן: מסמכי מִבדק).<br />
הדרישה המרכזית בבדיקה זו היא התאמה גבוהה ככל האפשר<br />
בין קביעת פרופיל המחבר על ידי התוכנה ובין ההגדרות<br />
האמיתיות, הידועות מראש במקרה זה. תוצאות ניתוח של<br />
מסמכי מבדק אלה הביאו לדיוק של מעל ל- - 80 % תוצאה<br />
שהספיקה כדי שתוכנת הזיהוי תהיה יישומית עבור טקסטים<br />
אנונימיים.<br />
עבודה עם כמות גדולה של מסמכי אימון מאפשרת<br />
בניית מאגר נתונים, המכיל מספר רב של מאפיינים בתוך<br />
47<br />
‡ÈÏÈÏ‚<br />
¯·Ó·Âapple<br />
≤∞∞∏