Midializado

Os problemas e desafios para uma análise de buzz

Continuando a série sobre análise de Buzz, agora irei comentar alguns problemas metodológicos, desafios e possíveis soluções e melhorias.

Bom, se voltarmos para meu último post, uma coisa que podemos perceber é que a planilha de classificação é a base de dados para a análise certo? Sem ela, a mais importante parte de uma análise de buzz, que é a tonalidade qualitativa dos dados, não pode ser realizada. Essa importância é o primeiro obstáculo da análise.

Para termos uma noção analítica se determinado buzz refere-se positiva ou negativamente, precisamos classificar os elementos do buzz para tal forma, certo? E como fazemos isso? Como determinamos e classificamos uma base para análise?

Na mão, literalmente. Sim, se tivermos uma base com 500 mil posts, é necessário que haja pessoas para classificarem e analisarem um por um para que os posts possam ser separados e, assim, possam gerar os dados para se realizar análise.

E por que não automatizar o processo? Por que não gerar um software que processe e classifique a base sem que necessite da intervenção humana? Pelo simples fato de que lidamos com pessoas. Lidar com dados gerados por pessoas não pode ser entregues para máquinas realizarem.

Exemplo para ficar claro: se temos um post contendo tom de ironia, não é possível para um software detectar. Dizer “eu amo derramar suco em mim“, para uma máquina quer dizer que “o emissor ama derramar nele mesmo“, mas para nós, que dotamos de interpretação de sentido, sabemos que isso não é verdadeiro. Além disso, existem jargões e expressões que máquinas não conseguirão compreender.

E nisso que entra um conhecimento analítico do profissional. Ele sabe distinguir diferentes situações e detectar as diferenciações que existem na base de análise para, com isso, conseguir analisar de forma mais fidedigna possível e oferecer soluções e idéias dentro da análise.

Não acho que a intervenção humana na formação da planilha de classificação seja um defeito, muito pelo contrário. Mas é um processo que exige muito tempo e mão-de-obra. Acredito que o humano tem que realizar esse trabalho, mas é necessário métodos visando o aprimoramento desse processo.

Uma solução é “padronizar” determinados assuntos e ganhar tempo na classificação. Filtrar por certas expressões que se definem absolutas para, assim, gerar uma classificação padronizada e automática para elas. Sim, é uma forma de automatização humana, mas pelo menos um ser humano terá o controle sobre isso e a margem de erro será bem menor.

No próximo post comentarei sobre a nuvem de tags, ou tag cloud, e seus problemas metodológicos.

Conheça nosso novo projeto:
www.atlasmedialab.com
Sair da versão mobile