A szentimentelemzés alapjai I.: áttekintés és szövegelemzés

A szentimentelemzés alapjai I.: áttekintés és szövegelemzés

A bejegyzés második része ittharmadik része itt olvasható.

A szentimentelemzés (más néven vélemény bányászat vagy érzelmi mesterséges intelligencia) szisztematikusan azonosítja, kivonja, számszerűsíti és tanulmányozza az érzelmi állapotokat és szubjektív információkat a természetes nyelvfeldolgozás (natural language processing vagy leggyakrabban egyszerűen csak NLP), szövegelemzés, számítógépes nyelvészet és biometria segítségével. 

Természetes nyelvfeldolgozás a nyelvészet, számítástechnika és mesterséges intelligencia egyik alterülete, ami a számítógép és az emberi nyelv interakcióival foglalkozik, konkrétan azzal, hogy hogyan lehet számítógépeket beprogramozni, hogy feldolgozzanak és elemezzenek nagy mennyiségű természetes nyelvi adatot. Célja, hogy a számítógép „megértse” a dokumentumok tartalmát, beleértve az adott nyelv kontextuális árnyalatait is. A 2010-es évekre beléptünk a neurális hálózatokon alapuló természetes nyelvfeldolgozás korába, illetve olyan szintre fejlődött a módszer, hogy a modellek 80 százalékot meghaladó hatékonysággal dolgoznak, ami azt jelenti, hogy utolérték az átlagos emberi teljesítményt. Természetesen ez nem azt jelenti, hogy a képessé váltak hibátlanul a „sorok között” olvasni, de reálisan nézve: az adott szöveget olvasó ember érzékenysége, kulturális háttere, műveltsége is meghatározza, hogy mennyire jutnak el hozzá a rejtett tartalmak. Ha feltételezzük, hogy lenne egy tökéletes algoritmus, ami hibátlan elemzésre képes, ez esetben is probléma lenne, hogy az emberek nagyjából az esetek 20 százalékában nem értenének egyet az algoritmus elemzésének eredményével (ahogy ezt egy másik emberrel sem tennék).

A teljes poszt ITT a kutatóintézet blogján elérhető


Címkék: szentiment elemzés