linked Ben Yehuda: סימון מקומות, תאריכים ואנשים וחיבור למידע

הרעיון הוא לקחת מאגר שמות מקומות (בהטיות שונות), תאריכים (בצורות כתיבה שונות) ואנשים (כנ"ל) ולייצר סימון אוטומטי של שמות מקומות ואנשים (ותאריכים).

מכיוון שהסימון יהיה אוטומטי, הייתי מציע שתהיה אופציה לערער על הזיהוי האוטומטי, ואז ייפתח יישום של חכמת המונים של הצבעה עבור הזיהויים השונים (אולי עם אפשרות לבלון עם הנמקות לזיהוי).

[ מה שיאפשר בשלב הבא פעולות נוספות (חיבור למידע על האנשים והמקומות (למשל אנשים לללקסיקון הספרות העברית ומקומות לויקיפדיה ולמפה) חיבור בין אזכורים, אתרים חיצוניים ועוד. – או לפחות להכין את התשתית לכך
ניתן גם לחשוב על ייצוג היסטורי גיאוגרפי של הפרויקט או של יוצרים וחיבוריהם על גבי מפה. ]

באותו אופן ניתן אולי לסמן שמות של יצירות ולחברם לספרות משנית על יצירות אלו?

אני נאלץ לעזוב את ההקאתון בשלישי לפנות בוקר ולכן לא אוכל להוביל את הקבוצה לאורך כל הדרך, ובכלל אני מזמין מעוניינים לקחת את ההובלה במשותף מן ההתחלה.

Categories: Crowdsourcing, Linked Data, Session: Make, Text Mining |

2 תגובות בנושא linked Ben Yehuda: סימון מקומות, תאריכים ואנשים וחיבור למידע

  1. מאת Sinai Rusinek‏:

    library.osu.edu/projects/hebrew-lexicon/ זה נראה לי המקור המתבקש לחיבור של שמות המחברים של כל יצירה. את האנשים שבתוך הטקסט, אולי נכון יותר לקשר לויקיפדיה.

    למקומות, אפשר לשקול את פנקס הקהילות data.jewishgen.org/wconnect/wc.dll?jg~jgsys~community~-1036442
    או את הגזטיר – www.jewishgen.org/Communities/LocTown.asp
    ואת geonames למקומות אוניברסליים יותר.

  2. מאת אסף ברטוב‏:

    מסכים עם המקורות לעיל.

    אותי מעניין במיוחד זיהוי של מקרים שבהם מחבר א' עוסק במחבר ב' (וספציפית, הבחנה בין אזכור זניח לבין טקסט שממש עוסק במחבר ב').

סגור לתגובות.