Notas

Nube de palabras


Para celebrar un año más de Mocionero, Pau Fiorini hizo un pequeño análisis de texto con la base de mociones.

El análisis de texto es una metodología muy utilizada en la academia, los medios de comunicación y el mercado para analizar fenómenos a través del análisis de las palabras y frases utilizadas. Por ejemplo, se lo ha utilizado para estudiar las discusiones parlamentarias estadounidenses y los debates en medios sociales de fenómenos como los Papeles de Panamá. Los analistas han hecho diferentes usos de estas técnicas, por ejemplo, han mirado la frecuencia con que se usan ciertas palabras y han hecho análisis de sentimientos estudiando qué emociones están asociadas a las palabras utilizadas.

En este primer post decidimos hacer uso de esta metodología porque nos puede ayudar a entender mejor cómo construímos las mociones. A pesar de no ser posible sacar conclusiones, la nube de palabras nos permite hacer un análisis descriptivo que puede llevarnos a reflexionar acerca del uso del vocabulario en el contexto de debates. A continuación aparece una imagen en forma de “nube de palabras” que destaca las palabras que aparecen más de 10 veces en el listado de mociones del Mocionero.

¿Qué podemos decir?
Las palabras que más aparecen son “no”, “país” y “estado”, como destaca el color y tamaño de la fuente. Palabras como “democracia” y “guerra” son menos frecuentes que “Internet”. Al observar la lista de quince palabras más frecuentes identificamos cuatro temas: (i) estado, naciones y gobiernos; (ii) derechos y educación; (iii) mujeres y (iv) Estados Unidos. Estos temas pueden ser fácilmente asociados a los temas de clasificación que tenemos en el Mocionero (“ciudadanía y gobierno”, “educación y cultura”, “salud y género” y “política internacional”). También destacamos que en términos de países/regiones, además de Estados Unidos y la Unión Europea, en el Mocionero hay muchas menciones a Latinoamérica, Argentina y Colombia. Finalmente, se observan palabras opuestas como sí/no y permitir/prohibir. En ambas dicotomías, las palabras asociadas con connotaciones negativas son más frecuentes.

Metodología
El trabajo se hizo con la actualización del Mocionero de diciembre de 2016, que tenía 2177 mociones. Usamos esa base excluyendo las frases que eran parte de información adicional. Hicimos un listado con todas las palabras y obtuvimos cerca de 4500 palabras (incluyendo números, como 2015) y homogeneizamos casos para que, por ejemplo, “UE” y “Unión Europea” fueran contadas como la misma palabra. Luego seleccionamos las palabras que aparecían más de 10 veces para que la nube fuera más clara y excluimos 96 palabras que consideramos que no aportaban demasiado (por ejemplo “debería”, “como” e “y”). La exclusión a partir de una frecuencia mínima de 10 veces excluyó palabras como “fútbol” y “homosexual”. En total obtuvimos una lista con 124 palabras.

¿Tenés ideas, dudas o sugerencias? ¡Compartilas con nosotros!

Publicado en Facebook el 5/1/2017.