סוכן חכם לזיהוי עיבודי אגדה, מקורותיהם ומדידת עוצמת זיקתם למקורותיהם
פרוייקט בן יהודה כולל בין היתר מספר טקסטים שהם עיבודים מודרניים (ובמקרים נדירים מוקדמים יותר) של מקורות אגדה מן הספרות התלמודית והמדרשית.
חומרים רבים מעין אלו מצויים גם באוספים ספרותיים רבים מימי הביניים, ואף בקטעי גניזה רבים.
הטיפול המחקרי בחומרים אלו כולל בין היתר את האיתור של המקורות והמקבילות של העיבודים, את הניסיון להבחין בין שימוש ישיר לבין הקבלה, את מדידת מידת האקטיביות של המעבד.
מבחינת השירות לציבור תוצרי הסוכן הם בעלי ערך מובהק אף יותר מן ההבטחה הטמונה בהם לקידום המחקר –
א. עצם הוספת ההפניות למקורות והקישור האוטומטי אליהם,
ב. אפשרות הצגת סינופסיס משווה היא התקדמות חשובה.
ג. חשוב מכך – יצירת קישור אוטומטי לכלי רשת ראויים שכבר קיימים לרבים מסיפורי האגדה: (1) אתר ספר האגדה; (2) דפים באתר מדרשת; — קישורים נוספים שאני לא מודע אליהם.
בדרך כלל מתבצעות שרשרות הפעולות הבאות:
א. חיפוש מקבילות באמצעות כלי חיפושי קיימים (בעיקר פרוייקט השו"ת).
ב. העמדה סינופטית של המקבילות בצד העיבודים.
ג. במקרה של עיבוד שלא נמצא מקורו – הערכת אופיו של המקור העומד ברקע העיבוד על פי מאפייני לשון וסגנון.
הפרוייקט המוצע ימכן מרכיבים שונים (ובודאי לא את כולם בבת אחת) בשלבי העבודה הזו:
א. זיהוי אוטומטי של טקסטים החשודים כהיותם עיבודי אגדה.
ב. איתור המקבילות / המקורות של מקורות אלו.
ג. מדידת 'עוצמת הזיקה', ונסיון להגדיר מדדים להגדרתה כשימוש ישיר או עקיף.
ד. חילול אוטומטי של סינופסיס.
ה. חילול אוטומטי של קישורים והפניות.
אתגרים יחודיים:
ו. זיהוי 'קלפים מנצחים' – מה הם האלמנטים המהותיים המאפשרים בקלות לאתר מקבילות? מימוש הפרוייקט באמצעות שימוש עקיף בכלים קיימים (סוכן חכם לחיפושים במאגרים קייימים; זיהוי כלים קיימים שמאפשרים מימוש מרכיבים מסויימים – כגון הכנת מקבילות);
ז. זיהוי זיקה בין עיבודים בעברית למקורות בארמית.
ח. פישוט האלגוריתם – זמני חיפוש קצרים וכדומה – לצורך ביצועו בהמשך על קורפוסים בסדר גודל רחב יותר.
משה, מה זה "סוכן" – נניח, באנגלית?
agent
משה, נראה לי שכדאי להעיף מבט בהצרנה של האנציקלופדיה התמטולוגית. אני לא בטוח שבצורה הנוכחית יש בה איזו תרומה, אבל זה נותן כיוון של ייצוג נראטיב באמצעים צורניים.
עמית – מה? תמטולוגית? הלו, זה רדיו?
דבר אתי בלינקים
הי עמית – יש לך קישור או קובץ פי די אף לשלוח לנו?
תודה
משה