עיתון אוניברסיטת בן-גוריון בנגב
חוסך במיילים , פרי פיתוחם של פרופ' מרק לסט (בצילום) ועמיתיו במחלקה להנדסת MUSE תוכנת לתשומת-לבם של חוקרי הבולשת | מערכות מידע, תאפשר לקרוא פחות ולדעת יותר אלף אי-מיילים בשמונה ימים 650 הפדרלית בארה"ב, שנאלצו לעבור על
העיקריים של הטקסט תוך התעלמות מפרטים קטנים ובלתי-חשובים? לטכנולוגיה שמאפשרת לנו לקרוא יותר חומר בפחות זמן קוראים "תימצות ,) automatic summarization אוטומטי" ( והיא נמצאת במוקד מחקרם של פרופ' מרק לסט, מן המחלקה להנדסת מערכות תוכנה ומידע, וקבוצת המחקר שלו. מטרתו המקורית של המחקר הייתה לזהות משפטי-מפתח בתוך טקסט בשפה כלשהי מתוך מאות השפות הנמצאות בשימוש באינטרנט. לכן יכלו החוקרים להסתמך אך ורק על מאפיינים סטטיסטיים של משפטים, כגון אורך המשפט באותיות ומילים או מיקומו היחסי בתוך המסמך. בניגוד למחקרים קודמים, שהגבילו את עצמם לכמות מצומצמת של MUSE ( MUltilingual Sentence Extractor) שפותח על-ידי פרופ' לסט ועמיתיו למחלקה, ד"ר מרינה ליטבק וד"ר מנחם
מדובר בבעיה רחבה הרבה יותר: כיצד לאתר את העיקר והחשוב בתוך זרם בלתי-פוסק של מידע טקסטואלי המציף אותנו מכל הכיוונים, מן הסטטוסים המתפרסמים במדיה החברתית, ממה שהוכנס לתיבת הדואר האלקטרוני שלנו ועד לכתבות באתרי החדשות. לכאורה סיפקה לנו טכנולוגיית המידע דרכים רבות ומגוונות לייצר תוכן מסוגים שונים ולהפיץ אותו במהירות במרחב המקוון; באמצעות מנועי חיפוש משוכללים עוזרת לנו הטכנולוגיה למצוא מיליוני תכנים שפורסמו בכל נושא שמעניין אותנו; אבל אופן צריכת התוכן, בעיקר התוכן הטקסטואלי, לא השתנה באופן מהותי – אנחנו קוראים מסמכים אלקטרוניים מן המסך או מדף מודפס באותה מהירות שבה היו אבותינו קוראים מגילות ופפירוסים. אולי הגיע הזמן לפריצת דרך טכנולוגית גם בתחום הזה? אולי המחשב יוכל לעזור לנו להתמקד בחלקים
אי-מיילים 650,000 "אי אפשר לקרוא בנובמבר 6- בשמונה ימים", כך אמר ב המועמד הרפובליקני לנשיאות ארה"ב (כיום הנשיא הנבחר) דונלד טראמפ. הוא התכוון להודעת הבולשת הפדרלית של , על סיום הבדיקה של קרוב FBI ארה"ב, ה- אלף תכתובות דואר אלקטרוני 650- ל שנמצאו במחשבו של אנתוני וינר, בן-זוגה לשעבר של העוזרת הקרובה של הילרי התחילה רק FBI קלינטון. בדיקת ה- לאוקטובר, 28- שמונה ימים קודם לכן, ב מה שהשאיר לסוכני הבולשת מעט מאוד זמן לקריאת כל הודעה וניתוח תוכנה. תגובתם של המומחים לעיבוד אוטומטי של טקסט לא איחרה לבוא: FBI הם הפיצו ברשת שלל עצות לסוכני כיצד אפשר לסרוק ולסנן כמות כזאת של הודעות בתוך דקות ספורות בלבד. הסוכנות הפדרלית אמנם לא מצאה לנכון לפרסם את פרטי השיטות והכלים שבהם השתמשה לצורך חקירתה המזורזת, אבל
מאפיינים, האלגוריתם
טכנולוגיית המידע | 8
Made with FlippingBook - professional solution for displaying marketing and sales documents online