Yael Netzer – THATCamp Haifa 2014 http://haifa2014.thatcamp.org Just another THATCamp site Tue, 23 Jan 2018 08:49:38 +0000 he-IL hourly 1 https://wordpress.org/?v=4.9.12 זיהוי דיאלוגים ודוברים http://haifa2014.thatcamp.org/2014/02/16/%d7%96%d7%99%d7%94%d7%95%d7%99-%d7%93%d7%99%d7%90%d7%9c%d7%95%d7%92%d7%99%d7%9d-%d7%95%d7%93%d7%95%d7%91%d7%a8%d7%99%d7%9d/ Sun, 16 Feb 2014 18:07:02 +0000 http://haifa2014.thatcamp.org/?p=367 להמשיך לקרוא ]]>

זיהוי דיאלוג ודוברים בטקסטים

הרעיון הוא לנסות לזהות דיאלוגים בטקסטים סיפוריים ולשייך לכל אמירה את הדובר שלה.

מתוך זיהוי והבנה של מהלך הדיאלוג אפשר לשרטט מערכות ואופי יחסים בסיפור, וגף לנסות לבודד ציטטות והבאת דברים ממקורות אחרים.

בעבודות קודמות, באנגלית — למשל

David K. Elson, Kathleen R. McKeown. 2010. Automatic Attribution of Quoted Speech in Literary Narrative. In Proceedings of the Twenty-Fourth AAAI Conference on Artificial Intelligence (AAAI 2010), Atlanta, Georgia. [PDF]

המשימה מתבצעת על ידי

–          זיהוי שמות פרטיים ושמות עצם בפסקה המקדימים את הציטוט במטרה למצוא דמויות או ביטויי התייחסות אליהן (שרלוק, מר הולמס, הבלש)

–          אם אפשר, השמה של מין (זכר / נקבה) לדובר

–          סימון דיאוגים בטקסט:

  • החלפת המרכאות " בסימן <>
  • זיהוי פועל דיבור <express_verb> ("קראו" "אמר" "פנתה")
  • הסרת מידע טקסטואלי עודף

ומיון סוגי הציטוטים:

–          Added quote: Bah!” said Scrooge, “Humbug!”

–         Quote alone: Quote appears by itself in a paragraph but “Apparent conversation”

does not apply.

–          Character trigram: <Target Quote>-<Expres Verb>-<Person>

–          Anaphora trigram: <TARGET QUOTE> <PRONOUN> <EXPRESS VERB>

–          All other quotes.

האם הכלים האלה יעבדו גם בעברית?

]]>