Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia Tuesday TopDrive KupDnes Navrcholu Bomba NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

O sentiment analýze bez sentimentu aneb jeden malý experiment

O sentiment analýze slýcháváme v souvislosti se social media monitoringem docela často. Většina velkých nástrojů na sledování sociálních sítí se chlubí nějakou formou strojové analýzy nálady příspěvků. Poněkud složitější je to ovšem s měřením jejich přesnosti.

Pokud totiž porovnáte výstupy z vybraných nástrojů, zjistíte, že se mezi sebou velice zásadně liší. Ostatně podívejte se na slajd číslo 18 velmi zajímavé prezentace Negative Sentiment (or „Sentiment Analysis is Sh*te“) od Mata Morrisona – už na první pohled něco není v pořádku.

Výsledky jednotlivých systémů se liší natolik zásadním způsobem, že je to až zarážející. Zvlášť pokud se obecně usuzuje, že relativně snadno dostupnými prostředky jako jsou bayesovské filtry či SVM, lze dosáhnout velmi rychle úspěšnosti přes 70 procent.

Potíž ovšem nastane ve chvíli, kdy se pokusíme tuto úspěšnost ověřit. Proč? Protože prostě není k dispozici žádný autoritativní dataset z reálných dat, vůči kterému bychom mohli měřit úspěšnost jednotlivých postupů. Zcela určitě to platí pro češtinu a do značné míry i pro angličtinu – to je dáno především tím, že anglické postupy jsou učeny a testovány na uživatelských recenzích, které jsou podstatně jiného žánru než příspěvky na Facebooku, Twitteru či jiné síti.

Když sentiment posuzují lidé

V Ataxu jsme se proto rozhodli udělat malý experiment ve spolupráci se studentem Studií nových médií Martinem Kubelkou. Náhodně jsme vybrali 90 zmínek z našeho nástroje pro monitoring sociálních sítí Ataxo Social Insider a ve dvou kolech jsme poprosili českou Twitter komunitu o to, aby posoudila, jaké mají zabarvení. Na výběr byla možnost pozitivní, neutrální nebo negativní.

V prvním kole bylo 90 otázek rozděleno do tří balíčků podle pořadí prokliku odkazu. U zmínky nebylo jasné, k jakému klíčovému slovu se vztahuje, takže kupříkladu zmínka „Nevolejte,nepiste mi na T-Mobile!!! Posral se mi IPhone!“ se vztahovala k T-Mobile, nikoli k iPhone.

Druhé kolo vypadalo stejně, jen bylo řečeno, které slovo bylo monitorováno. V obou kolech měl každý dotazník více než 30 účastníků. Důvod, proč byla kola dvě, je zcela prostý: U postupů typu SVM stroj prostě neví, k jakému slovu se výrok vztahuje, u postupů využívajících kupříkladu polarizační slovník to vědět může. Protoje dobré mít vyhodnocené datasety dva. Navíc u metod strojového učení, kam patří SVM i Bayes, hodně záleží na cvičícím materiálu, takže motivací bylo i vytvořit základ pro budoucí učební korpus.

Původním cílem výzkumu bylo připravit si měřítko pro námi vyvíjenou službu na určení sentimentu zmínky. Výsledek však ukazuje jednu zásadní věc: Běžní uživatelé sociálních sítí nejsou možná vůbec schopni se shodnout na tom, jaký sentiment zmínka vyjadřuje.

UX konference
       

V prvním kole totiž byla 70% shoda o sentimentu zmínky pouze v 30 případech z 90, tedy v jedné třetině! V druhém kole, kdy respondenti znali monitorované klíčové slovo, byla shoda o něco lepší, 70 % uživatelů se shodlo v 43 případech z 90. Tedy ani ne v polovině případů. Ostatně na celý set i s výsledky se můžete podívat v této prezentaci.

Co to všechno zřejmě znamená

  • Lidé mají sami mezi sebou velký problém se shodnout na tom, co je pozitivní, co neutrální a co negativní.

  • Zdá se, že shoda je tím větší, čím text obsahuje více z polarizačního či dokonce vulgárního slovníku.

  • Většina zmínek má bez kontextu komunikace zcela ambivalentní význam.

  • Lépe se detekuje extrémní negativita, než drobná pozitivita.

Závěr? Není. Naše malá studie patří do většího celku výzkumu, který v Ataxu děláme. Ukazuje se, že z pohledu social media monitoringu je třeba být se strojovou sentiment analýzou velmi opatrní a je třeba vždy u každého klienta promyslet, proč ji potřebuje a jak ji sám vlastně vnímá.

Josef Šlerka

Josef Šlerka je šéfem vývoje a výzkumu ve společnosti Ataxo Interactive, zároveň vede Studia nových médií na FF UK

Školení online marketingu - Dobrý web

DW - Školení PPC
  • Jak investovat peníze tam, kde se budou vracet.
  • Jak vydělávat na SEO, PPC i sociálních médiích.
  • Kurz pro všechny, kteří řeší online marketing.

Detailní informace o školeních výkonnostního marketingu »

Přehled názorů

Sentiment analýza v plenkách :-)
Jean Laroux 14. 7. 2011 08:16
Nový
Robotické vyhodnocení sentinentu = rozhodně ano
Jakub Mach 14. 7. 2011 08:53
Nový
├ 
Re: Robotické vyhodnocení sentinentu = rozhodně ano
Jean Laroux 14. 7. 2011 09:47
Nový
│
└ 
Re: Robotické vyhodnocení sentinentu = rozhodně ano
souhlas 14. 7. 2011 10:26
Nový
├ 
Re: Robotické vyhodnocení sentinentu = rozhodně ano
Michal Illich 14. 7. 2011 11:39
Nový
└ 
Re: Robotické vyhodnocení sentinentu = rozhodně ano
Ivo.Minarik 14. 7. 2011 11:47
Nový
nestačí prostě měřit četnost výskytu určitých slov?
Pepa 14. 7. 2011 12:00
Nový
├ 
Re: nestačí prostě měřit četnost výskytu určitých slov?
Ivo.Minarik 14. 7. 2011 12:50
Nový
└ 
Re: nestačí prostě měřit četnost výskytu určitých slov?
Jean Laroux 14. 7. 2011 13:01
Nový
 
└ 
Re: nestačí prostě měřit četnost výskytu určitých slov?
Ivo.Minarik 14. 7. 2011 13:07
Nový
 
 
├ 
Re: nestačí prostě měřit četnost výskytu určitých slov?
Adam Zbiejczuk 14. 7. 2011 13:21
Nový
 
 
│
└ 
Re: nestačí prostě měřit četnost výskytu určitých slov?
Jean Laroux 14. 7. 2011 13:36
Nový
 
 
└ 
Re: nestačí prostě měřit četnost výskytu určitých slov?
Jean Laroux 14. 7. 2011 13:29
Nový
 
 
 
└ 
Re: nestačí prostě měřit četnost výskytu určitých slov?
Ivo.Minarik 14. 7. 2011 13:38
Nový
 
 
 
 
└ 
Re: nestačí prostě měřit četnost výskytu určitých slov?
Jean Laroux 14. 7. 2011 13:42
Nový
problém lidského činitele
Tomáš Kapler 14. 7. 2011 13:47
Nový
Několik postřehů
Jan Hrdlička 14. 7. 2011 16:01
Nový
└ 
Re: Několik postřehů
Josef Šlerka 14. 7. 2011 17:30
Nový
 
└ 
Re: Několik postřehů
Miroslav Spousta 15. 7. 2011 19:41
Nový
 
 
└ 
Re: Několik postřehů
Josef Šlerka 15. 7. 2011 21:55
Nový
supr clanek
Pavel Curda 15. 7. 2011 11:31
Nový
supr clanek
Pavel Curda 15. 7. 2011 11:33
Nový
na kolik % fungovala strojova analyza sentimentu ASI ?
Pavel Curda 15. 7. 2011 12:37
Nový
└ 
Re: na kolik % fungovala strojova analyza sentimentu ASI ?
Josef Šlerka 15. 7. 2011 13:35
Nový
zivot je plny "prekvapeni"
ignorant 23. 7. 2011 13:33
Nový
├ 
Re: zivot je plny "prekvapeni"
KvěciProsím 27. 10. 2011 18:20
Nový
└ 
Re: zivot je plny "prekvapeni"
KvěciProsím 27. 10. 2011 18:46
Nový
       

Tento text je již více než dva měsíce starý. Chcete-li na něj reagovat v diskusi, pravděpodobně vám již nikdo neodpoví. Pro řešení aktuálních problémů doporučujeme využít naše diskusní fórum.

Zasílat nově přidané příspěvky e-mailem