Los sentimientos hacia el TLCAN, 'desmenuzados' por actuario IBERO

Mié, 22 Ago 2018
A partir de la ciencia de datos y tuits, el Dr. Robert Hernández hace un análisis sobre las negociaciones comerciales entre México, EU y Canadá
  • La renegociación del TLCAN entró en su etapa final, de acuerdo con algunos medios (Tomada de Foreing Policy).
Por: 
Dr. Robert Hernández Martínez, coordinador de la Licenciatura en Actuaría de la Universidad Iberoamericana Ciudad de México.

“Tweet like nobody's following....”

31 Quotes About Twitter Under 140 Characters

Negociación compleja que no termina de cerrarse es la que ocurre entre las naciones participantes en el Tratado de Libre Comercio de América del Norte (TLCAN). Ante la renovación del Congreso de los Estados Unidos, en noviembre de 2018, y el cambio de gobierno en México, en diciembre de este año, la fecha límite para alcanzar un acuerdo ha llegado y tal vez se vislumbre la posibilidad del retiro de la mesa de negociaciones, en lugar de reiniciarlas en nuevas condiciones y con otros personajes.

Frente a este escenario resulta pertinente aplicar algunas técnicas de ciencia de datos para realizar un análisis de sentimientos sobre el TLCAN, a partir del examen de los tuits publicados por usuarios de la red social Twitter, tomando en cuenta que es un medio directo y de gran impacto en el mundo -el cual supera en inmediatez a los medios de comunicación tradicionales-.

Lo anterior es evidente cuando los 140 caracteres permitidos por Twitter son utilizados por personajes relevantes como Donald Trump; prácticamente no hay medio de información en el mundo que no siga las cuentas @realDonaldTrump y @POTUS, del Presidente de los Estados Unidos, pues sus mensajes impactan política, económica, social y estratégicamente al mundo entero… además de los millones de tuits y retuits que desencadena la reacción inicial.

En estos casos, la ciencia de datos permite explorar la materia prima de información (publicaciones en Twitter) y transformarla en descubrimientos comprensibles para la toma de decisiones. Por ejemplo ¿cuáles son los términos recurrentes que se mencionan en torno al tema del TLCAN?, ¿cómo está el ánimo de los usuarios al respecto? o ¿el balance es positivo o negativo?

Difícilmente, podría llevarse a cabo este análisis sin herramientas de estadística computacional y gráficas generadas por un software apropiado como ‘R’, el cual es un ambiente de uso libre desarrollado de manera colaborativa por usuarios de todo el mundo, actualmente muy popular en grandes compañías para aplicaciones de análisis de datos, modelación estadística y visualización de resultados.

El primer paso a seguir es obtener acceso a las publicaciones de Twitter mediante las credenciales proporcionadas por esta empresa una vez que se explica el propósito del estudio; dichas credenciales son incorporadas en la programación del código en ‘R’ para recuperar un número solicitado de tuits que pueden ser 'los más recientes', 'los más populares' o una mezcla de ambos.

Para fines de este análisis, se han solicitado 100 tuits en inglés que contengan la palabra NAFTA (siglas en inglés del TLCAN). Al ejecutar el programa, éste buscará una mezcla de publicaciones que será la materia prima a depurar.

En términos sencillos, se trata de crear una base de información con los tuits de los usuarios respecto a un tema de interés, la cual se limpiará de caracteres innecesarios hasta obtener un vector de palabras denominado corpus, que contiene la semántica de los mensajes; es decir, la interpretación clara y precisa de cada palabra escrita en un tuit.

Por lo tanto, el corpus deberá omitir signos de puntuación, palabras que no contienen información de importancia, como artículos y preposiciones, números, espacios en blanco; entre otros caracteres especiales. Así, la programación en ‘R’ permite obtener un gráfico de palabras recurrentes en la base de datos; en la nube de palabras resultante, el tamaño y color de cada una de ellas indica su frecuencia o importancia en el corpus.

Para el caso del NAFTA, la nube de palabras obtenida al martes 21 de agosto de 2018, cuando está próxima la fecha de cambios políticos tanto en México como en Estados Unidos, se aprecia en la siguiente ilustración:

ilustracion_1.png

Ilustración 1: Nube de palabras a partir de la recuperación de 100 tuitts sobre el tema NAFTA, incluye una mezcla de tuits recientes al 21 de agosto de 2018 y tuits más populares. Fuente: Elaboración propia en el software R.

Como puede apreciarse, entre las palabras más mencionadas en torno al NAFTA se encuentran: public (público), talks (negociaciones), tariff (arancel), racist (racista), negotiations (negociaciones), questions (preguntas), owed (deber), y muchas otras cuyo tamaño de letra disminuye y su color cambia conforme se vuelven menos recurrentes.

Así encontramos la respuesta a la primera pregunta enunciada en párrafos anteriores: se pueden conocer los términos clave en la percepción de los usuarios de la red social Twitter acerca de la renegociación del NAFTA. Una de las características sobresalientes de este modelo es que puede hacerse en tiempo real, pues la recuperación de los tuits es inmediata al ejecutar el programa; por lo tanto, la nube de palabras cambia de un momento a otro acorde a la tendencia seguida por el tema en estudio.

Respecto al estado de ánimo de los usuarios -conocido como análisis de sentimientos-, el modelo desarrollado se sustenta en la comparación del corpus con un listado de palabras de opinión positiva y otro listado de palabras de opinión negativa (palabras de sentimientos), desarrollado por expertos lingüistas con un conteo aproximado de seis mil 800 palabras, incluyendo algunas escritas de manera incorrecta o 'con error de dedo', como una forma de simular lo que habría querido escribir un usuario, pero por algún motivo escribió con faltas de ortografía.

En este sentido, vale la pena mencionar que los listados citados se encuentran en inglés, pues la exploración de textos en español aún es escasa y requiere la colaboración de expertos en el idioma para construir una estructura que pueda ser utilizada por herramientas de ciencias de datos; además, en el mundo digital no sólo se trata de palabras, sino también de signos que denotan un significado o emoción, como en el caso de un emoticón.

En el caso que nos ocupa, el resultado del modelo muestra que de 100 tuits recuperados, existen 69 menciones de opinión positiva versus 50 menciones de opinión negativa, cuya diferencia arroja un sentiment score (puntaje de sentimiento) de 19 positivo; por lo tanto, se concluye que a la fecha de este análisis, el entorno de la red social Twitter es favorable acerca de la renegociación del NAFTA.

Este análisis puede extenderse a un mayor número de tuits en función de la capacidad de procesamiento del equipo de cómputo en que se ejecute ‘R’, la capacidad de la conexión a la red; y desde luego, el límite máximo que permita recuperar la aplicación de Twitter.

Gracias a la ciencia de datos es factible realizar descubrimientos en la audiencia de Twitter, identificar tendencias e investigar patrones de datos sobre publicaciones en tiempo real; por ejemplo, movimiento de mercados, tendencias emergentes, tópicos relevantes, noticias de última hora, entre otros contextos inciertos.

En este sentido, la Licenciatura en Actuaría de la IBERO se distingue por la innovación tecnológica en ciencia de datos, mediante el manejo de grandes volúmenes de información, para la toma de decisiones, con una perspectiva social.

El plan de estudios de la IBERO cumple a cabalidad con las guías educativas emitidas por la International Actuarial Association (IAA) contenidas en la última revisión del Syllabus Actuarial, vigente a partir de octubre de 2017; con objeto de dotar de herramientas modernas para los desafíos que enfrenta la profesión actuarial y cubrir eficientemente las necesidades de la sociedad en un entorno a nuevos riesgos globales.

Adicionalmente, la IBERO ha sido incorporada a la Comisión Técnica Consultiva de Actuaría de la Secretaría de Educación Pública (SEP), participando en las consultas sobre la calidad de la enseñanza y el ejercicio profesional de la Actuaría en México, en coordinación con el Colegio Nacional de Actuarios (CONAC) y la Dirección General de Profesiones de la Secretaría de Educación Pública (SEP).

Si desea conocer más sobre la aplicación presentada en este artículo puede escribir a la Coordinación de la Licenciatura en Actuaría de la Universidad Iberoamericana Ciudad de México, a: robert.hernandez@ibero.mx

PRL/ICM

 

Las opiniones y puntos de vista vertidos en este comunicado son de exclusiva responsabilidad de quienes los emiten
y no representan necesariamente el pensamiento ni la línea editorial de la Universidad Iberoamericana.

Para mayor información sobre este comunicado llamar a los teléfonos: (55) 59 50 40 00, Ext. 7594, 7759
Comunicación Institucional de la Universidad Iberoamericana Ciudad de México
Prol. Paseo de la Reforma 880, edificio F, 1er piso, Col. Lomas de Santa Fe, C.P. 01219