Kuidas teostada tekstianalüüsi?

Ettevõtetesse koguneb liskas numbrilistele andmetele üha enam tekstilist infot, näiteks klientide tagasiside, arenguvestlused, töötajate ettepanekud, koosolekud jms. Samuti saab tekstianalüüsi abil koguda infot foorumitest, kodulehtedelt, ajakirjandusest ja mujalt. Tihti annab tekst rohkem informatsiooni kui numbrid, näiteks soovitusindeksi puhul on olulisemail kohal klientide põhjendused. Seega on tekstianalüüs üks tähtis vahend ettevõtte arendamiseks. Kuidas pikkadest kommentaaridest leida üles põhiline ja mida selle infoga teha?

Kui me kasutame uuringute jaoks poolstruktureeritud küsimustikke, on sees nii avatud kui ka suletud küsimused. Avatud küsimused annavad vastajatele võimaluse ennast vabalt väljendada ja hinnanguid kommenteerida. Tekstianalüüsi abil saame teada, miks on vastajate hinnangud just sellised ja millised on nende ettepanekud ettevõtte arenguks. Selleks, et kõigi kommentaaride peale leida üles põhilised ettepanekud ja murekohad, märgistame iga kommentaari ühe või mitme märksõnaga. Seejärel koostame märksõnade alusel sagedustabeli ja visualiseerimiseks sõnapilve (vt näidet allpool). Samuti toome uuringuraportis välja kõige ilmekamad kommentaarid tsitaatidena. Niimoodi moodustuvad sadadest kommnetaaridest konkreetsed ettepanekud.

Näide sõnapilvest – kirjeldus ühe ettevõtte omadustest

Tekstianalüüsi jaoks on loodud mitmeid programme. Kõige lihtsamatesse on võimalik sisestada kogu tekst ja seejärel moodustab programm automaatselt sagedustabeli ja sõnapilve. Eestikeelsete vastuste puhul tulevad automaatse tekstianalüüsi puhul kõige sagedasemateks sõnadeks enamasti „ja“, „ning“, „või“, „on“ jms. Rohkemate võimalustega programmid võimaldavad sellised sõnad sagedustabelist eemaldada. Siiski säilib probleem valesti kirjutatud sõnadega – näiteks kui sõna „probleem“ on kirjutatud kahte moodi: „probleem“ ja „problem“, siis kohtleb programm neid kui eraldi sõnu. Samuti ei pruugi automaatse programmi kasutamisel esile tulla peamist mõtet ja sõnadeks tükeldatud kommentaarid ei anna enam infot edasi. Seetõttu soovitame tekstilised andmed esmalt kodeerida.

Kodeerimise puhul on samuti abistavaid programme. Näiteks pakub NVivo võimalust intervjuud programmi sisestada ja seejärel igale intervjuu osale märksõnasid lisada. Märksõnadest moodustub automaatselt koodipuu ja hiljem on kerge leida üles kõik kohad, kus kindlast teemast on räägitud. Samuti on olemas mitmeid programme, mis pakuvad võimalust automaatseks transkribeerimiseks ehk programm muudab helifaili tekstifailiks. Kahjuks tekib ka nende programmide puhul eestikeelse teksti puhul mitmeid vigu ning probleeme võib tekitada ka liiga vali või vaikne salvestus.

Kokkuvõtvalt on turul saadaval mitmeid tekstianalüüsi tööriistu. Siiski on tekstianalüüsi puhul väga oluline roll analüütikul – kodeerimine ehk kommentaaridele märksõnade lisamine peab lähtuma uuringu eesmärgist ja märksõna peaks kajastama kommentaari põhilist ideed. Praegusel hetkel ei suuda automaatsed programmid inimest asendada, kuid võimaldavad tekstianalüüsi protsessi lihtsustada. Tekstianalüüsi puhul on kolm olulist sammu: teksti kogumine, kodeerimine ja analüüsimine. Nende sammude läbimine võimaldab pikkadest kommentaaridest leida üles põhilised ideed ja olulised ettepanekud.

Virve Kass

Kirjuta esimene kommentaar