עיתון אוניברסיטת בן-גוריון בנגב
משפטי
או מיקומו היחסי בתוך המסמך. בניגוד למחקרים קודמים, שהגבילו את עצמם לכמות מצומצמת מאוד MUSE של מאפיינים, האלגוריתם Multilingual Sentence( ) שפיתחו פרופ’ לסט Extractor ועמיתיו למחלקה, ד”ר מרינה ליטבק וד”ר מנחם פרידמן, בוחר 30 את משפטי-המפתח בעזרת פרמטרים שניתן לחשב אותם עבור כל משפט בכל שפה. איכות MUSE הסיכומים האוטומטיים של נבחנה על-ידי השוואתם לסיכומים ידניים שכתבו דוברי שפות שונות. “התוצאות על מאגרי מסמכים מסוכמים בארבע שפות - אנגלית, עברית, ערבית ופרסית - הוכיחו שהאלגוריתם מספק סיכומים קרובים יותר לסיכומים האנושיים לעומת שיטות סטטיסטיות אחרות של תימצות אוטומטי”, אומר פרופ’ לסט. עוד התברר שלסיכומים בשפות השונות יש מאפיינים דומים המאפשרים “לאמן” מודל של תימצות על שפה נפוצה יותר, כגון אנגלית, ולהפעיל אותו בהצלחה על מסמכים בשפה שונה לגמרי, כגון עברית או פרסית. עכשיו עובד פרופ’ לסט, בשיתוף עם ד”ר ליטבק ועם ד”ר נטליה וונטיק מן המכללה האקדמית להנדסה על שם סמי שמעון, על נושא קרוב – קיצור משפטים ארוכים על-ידי השמטת פרטים בעלי חשיבות משנית מתוך המשפט. החוקרים מקווים שבסיום עבודתם יוכלו לייצר סיכומים קצרים וממוקדים שיאפשרו לדעת יותר תוך קריאת פחות חומר.
אני חושב עכשיו על התגובה שהוא היה יכול לצפות לה כשהניח למילים תמוהות כאלה לצאת מקצה לשונו. מלים, 140 המשפטים האלה מכילים בלבד מן הטקסט המלא של 27%- כ הנאום, שניתוחו נעשה על בסיס הרשמי לשפה האנגלית. ונשאלת השאלה: מה מתוך נאומו של שליט המדינה המבודדת נזכור בעוד כמה שנים? לשאלה הזאת תוכנת התימצות אינה יודעת לתת תשובה. “מדהים אותי שמאה שנה אחרי מהפכת אוקטובר וכמעט רבע- מאה לאחר קריסת ברית המועצות, ארה”ב והעולם החופשי עדיין מאוימים על-ידי שליט של מדינה קומוניסטית המחזיקה בנשק גרעיני”, אומר פרופ’ לסט. והוא מוסיף בנימה צינית: “ללא ספק מדובר בהמשך ראוי למורשתו המפוארת של החבר ניקיטה חרושצ'וב, 1964- שליט ברית המועצות בשנים , שהבטיח למדינות המערב בשנת 1953 : ‘אנחנו נקבור אתכם!'". 1956 לטכנולוגיה שמאפשרת לנו לקרוא יותר חומר בפחות זמן קוראים automatic( ” “תימצות אוטומטי ), והיא נמצאת summarization במוקד מחקרם של פרופ’ מרק לסט, מן המחלקה להנדסת מערכות תוכנה ומידע, וקבוצת המחקר שלו. מטרתו המקורית של המחקר הייתה לזהות משפטי-מפתח בתוך טקסט בשפה כלשהי מתוך מאות השפות הנמצאות בשימוש באינטרנט. לכן יכלו החוקרים להסתמך אך ורק על מאפיינים סטטיסטיים של משפטים, כגון אורך המשפט באותיות ומילים
מחץ
exercising a corresponding, highest level of hardline countermeasure in history.(11) מאחר שטראמפ שלל את קיומי והעליב אותי ואת ארצי מול עיני העולם ופרסם את הכרזת המלחמה הפראית ביותר בהיסטוריה [בה אמר] שיהרוס את הרפובליקה הדמוקרטית העממית של קוריאה, אנחנו נשקול ברצינות הפעלת אמצעי-נגד הולם, הנוקשה ביותר בהיסטוריה. I am now thinking hard about what response he could have expected when he allowed such eccentric words to trip off his tongue. (15)
7 | אבג
Made with FlippingBook Online newsletter creator