23.02.2015 Views

ÌȯȄ‡ ÌȉÂχ ¨‰Ú˙Ù‰ ‰Ú˙Ù‰ ø‰Ê ˙‡ ·˙Î ÈÓ - אוניברסיטת בר אילן

ÌȯȄ‡ ÌȉÂχ ¨‰Ú˙Ù‰ ‰Ú˙Ù‰ ø‰Ê ˙‡ ·˙Î ÈÓ - אוניברסיטת בר אילן

ÌȯȄ‡ ÌȉÂχ ¨‰Ú˙Ù‰ ‰Ú˙Ù‰ ø‰Ê ˙‡ ·˙Î ÈÓ - אוניברסיטת בר אילן

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

ÔÏȇ–¯· ˙ËÈÒ¯·Èapple‡ ȯ˜ÁÓÓ<br />

ÔÏȇ–¯· ˙ËÈÒ¯·Èapple‡ ȯ˜ÁÓÓ<br />

º º<br />

øÊÂapple‚‰ ¯ÙÒ‰ ˙‡ ·˙Î ÈÓ<br />

·˘ÁÓ‰ ˙appleÎÂ˙ ˙ÂÚˆÓ‡· ‰¯˙Ùapple˘ ˙ÂÓÂÏÚ˙‰ ˙Á‡<br />

≠˘È‡ Ô·¢‰ ‰appleÂÎÓ‰ ¨ÌÈÈÁ ÛÒÂÈ ·¯‰ Ï˘ ÂÈ·˙η ‰˜ÒÚ<br />

ÈÙÏ ÆÌÈapple˘ ±∞∞ ≠Î ÈappleÙÏ „„‚·· È˘‡¯‰ ·¯Î Ô‰È΢ ¨¢ÈÁ<br />

ÏÚ ÆÚÂ„È ‡Ï ¯·ÁÓ˘ ¨ÊÂapple‚ ¯ÙÒ ‡ˆÓ ‡Â‰ ¨·¯‰ ˙appleÚË<br />

¯ÙÒ‰ ¨˙ÈÏ‚˙‰ ˙ÂÈ¯Â˜Ó ˙‡ ÍÈ¯Ù‰Ï Â‡ ÁÈÎÂ‰Ï ˙appleÓ<br />

˜„·apple ¢ÈÁ≠˘È‡ Ô·¢‰ Ï˘ ÌÈËÒ˜Ë‰Ó „Á‡Â ÊÂapple‚‰<br />

Èapple˘˘ ÍÎ ÏÚ Â„ÈÚ‰ ˙‡ˆÂ˙‰ ƉappleÎÂ˙‰ ˙¯ÊÚ· ÏÈ·˜Ó·<br />

Æ Æ Æ¯·ÁÓ Â˙‡ Ï˘ Â˙¯ÈˆÈ ȯ٠̉ ÌȯÙÒ‰<br />

של מילים,‏ ביטויים וצירופי לשון ספציפיים במסמכי<br />

האימון,‏ ומפעילה שיטות של למידת מכונה כדי לבנות<br />

נוסחה המסווגת כל אחד ממסמכי האימון לקבוצת<br />

שייכות.‏ אותה נוסחה משמשת מודל חיזוי לניתוח<br />

טקסטים חדשים ולסיווגם ‏(איור 1).<br />

לשם בדיקת מידת הדיוק של מודל החיזוי הריצו קופל ושלר<br />

את תוכנת הזיהוי על טקסטים בעל מאפייני מחבר ידועים,‏<br />

שכמובן לא שימשו לבניית המודל ‏(להלן:‏ מסמכי מִבדק).‏<br />

הדרישה המרכזית בבדיקה זו היא התאמה גבוהה ככל האפשר<br />

בין קביעת פרופיל המחבר על ידי התוכנה ובין ההגדרות<br />

האמיתיות,‏ הידועות מראש במקרה זה.‏ תוצאות ניתוח של<br />

מסמכי מבדק אלה הביאו לדיוק של מעל ל-‏ - 80 % תוצאה<br />

שהספיקה כדי שתוכנת הזיהוי תהיה יישומית עבור טקסטים<br />

אנונימיים.‏<br />

עבודה עם כמות גדולה של מסמכי אימון מאפשרת<br />

בניית מאגר נתונים,‏ המכיל מספר רב של מאפיינים בתוך<br />

47<br />

‡ÈÏÈÏ‚<br />

¯·Ó·Âapple<br />

≤∞∞∏

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!