פרשת יין בעיר וניתוח סנטימנט אוטומטי: אין דבר כזה פרסום רע?

September 16, 2017

השבוע העלתה רשת "יין בעיר" קמפיין נוסף שקושר אלכוהול וביזוי נשים. אין צורך להכביר מילים על הפרשה, אבל נקודה מעניינת היא האסטרטגיה שבחרה שדולת הנשים להתמודדות עם הקמפיין הפוגעני. מתוך הנחה שהוגה הקמפיין תכנן אותו כך שיגרור תגובות סוערות שרק יגדילו את העניין בקמפיין ואת מידת החשיפה אליו, החליטה שדולת הנשים שלא להתייחס אל הפוסט עצמו, ולכתוב באופן אישי רק על הפרסומאי העומד מאחוריו, תוך קריאה למחאה כנגד אותו אדם.

 

האסטרטגיה של שדולת הנשים הצליחה. יין בעיר מחקו את הפוסט,  ורבים שדנו בקמפיין השלילי השכילו שלא לשתף אותו על מנת לא לשרת את כוונת הוגה הקמפיין ליצור תוכן ויראלי. מבחינתי, זו היתה הזדמנות טובה לבדוק את מנתח הסנטימנט שלנו, ולראות האם הוא יכול לשקף נכונה את הלך הרוח הציבורי כפי שהוא משתקף מהתגובות לפוסט של שדולת הנשים.

 

קצת במספרים: הפוסט זכה ל 880 שיתופים, 2253 לייקים ו- 271 תגובות. את התגובות הורדנו באמצעות כלי לכריית מידע מפייסבוק שפיתחנו במעבדה הפתוחה למדיה ולמידע של האוניברסיטה הפתוחה. לכלי שלנו יש רכיב של זיהוי סנטימנט אוטומטי, המבוסס על אימון של אלגוריתם על בסיס אלפי תגובות שקודדו ידנית ואיכותנית, ואשר תוקפו על ידי שתי חוקרות של המעבדה. עבור כל תגובה, האלגוריתם מזהה סנטימנט כללי וגס מאד, המחולק ל "חיובי" (ערך 1), "שלילי" (ערך -1), ו"נייטרלי" (ערך 0). למרות שאנחנו עדיין עובדים על תיקוף מדעי של מידת הדיוק של אלגוריתם זיהוי הסנטימנט שלנו (וזה ייקח זמן, לכן איננו מפרסמים עדיין את הכלי), עד כה הוא עושה עבודה לא רעה, והבדיקה הקצרה שערכתי על הפוסט של שדולת הנשים מראה את התמונה הבאה:

 

ציון הסנטימנט הממוצע של 271 התגובות לפוסט של שדולת הנשים הוא -0.79, כלומר, מרבית התגובות היו שליליות ויצאו כנגד הוגה הקמפיין.

 

עוד נתון מעניין עולה כאשר מסתכלים על פיזור סנטימנט התגובות בהשוואה למספר הלייקים שכל תגובה מקבלת, כפי שניתן לראות בגרף הבא:

 

מגרף הפיזור אפשר לראות שאכן הסנטימנט של הרוב המכריע של התגובות הוא שלילי, ושתגובות עם סנטימנט שלילי זכו ללייקים רבים מאנשים שקראו את העמוד. לייקים אלה יכולים להיקרא כאקט של הסכמה, ולמעשה מוסיפים משקולת נוספת לסנטימנט של התגובות השליליות כאמדן להלך הרוח הציבורי בנוגע לפרשה זו.

 

למעשה, ישנן רק 13 תגובות שקיבלו ציון סנטימנט אוטומטי חיובי. רובן ככולן מכילות מילות תודה לשדולת הנשים.

 

בגרף, ציינתי שלוש דוגמאות לטקסטים של הפוסטים שהאלגוריתם זיהה כחיובי או שלישי, ושזכו למספר הרב ביותר של הלייקים.

 

הדוגמא של התגובה שקיבלה ציון סנטימנט אוטומטי שלילי ואת מספר הלייקים הרב ביותר ממחישה עד כמה זיהוי סנטימנט הוא דבר מורכב. בדוגמא, נציגה של קבוצה משפיעה בפייסבוק מביעה מצד אחד הזדהות עם הפוסט של שדולת הנשים, ומצד שני מביעה התנגדות לקמפיין של יין בעיר. למרות שאפשר לדון בשאלה כיצד מקודדת איכותנית היתה מגדירה טקסט של סנטימנט מורכב, כאשר אנחנו מסתכלים על הציון הממוצע של סנטימנט של מספר גדול של תגובות - אי אפשר לטעות בהלך הרוח הכללי. במקרה הזה, הלך הרוח מביע קונצנזוס: יש דבר כזה פרסום רע.

 

 

 

Please reload

Recent Posts

Please reload

Archive

Please reload

Tags

Please reload

Follow