Modelo computacional de minería de microblogs para el análisis del comportamiento del consumidor de telefonía celular
Los mensajes de Twitter están siendo cada vez más usados para determinar el sentimiento de los consumidores de servicios o productos. Para ello se hacen uso de diversas técnicas computacionales, desde las tradicionales adaptadas de problemas de clasificación de textos y las recientes que usan mod...
Autor Principal: | Apaza Delgado, Santiago Hernán |
---|---|
Formato: | info:eu-repo/semantics/masterThesis |
Idioma: | Español |
Publicado: |
Pontificia Universidad Católica del Perú
2016
|
Materias: | |
Acceso en línea: |
http://tesis.pucp.edu.pe/repositorio/handle/123456789/7515 |
Etiquetas: |
Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
|
Sumario: |
Los mensajes de Twitter están siendo cada vez más usados para determinar el sentimiento
de los consumidores de servicios o productos. Para ello se hacen uso de diversas técnicas
computacionales, desde las tradicionales adaptadas de problemas de clasificación de textos
y las recientes que usan modelos de aprendizaje de máquina. En ambos enfoques se debe
desarrollar una serie de etapas que van desde el pre–procesamiento hasta la evaluación.
El presente documento muestra el resultado del proceso de aplicación de diversas técnicas
de Análisis de Sentimiento para poder asignar una polaridad positiva, negativa o neutral a
los tweets de los consumidores de telefonía celular en el Perú, con la finalidad de poder
identificar cual es el comportamiento que presentan los clientes de las empresas de telefonía
celular representado en opiniones vertidas en la red social Twitter.
Para ello se extrajeron 26,917,539 publicaciones de la red social Twiter durante 2 periodos,
cada uno de 30 días. Estas publicaciones corresponden a los tweets de los seguidores de tres
empresas de telefonía celular en el Perú, incluyendo una relativamente nueva en el mercado
peruano. El procedimiento seguido comprendió las siguientes tareas: a) Recolección de
tweets de los seguidores de las empresas de telefonía celular; b) Pre–procesamiento de la
data obtenida para poder identificar elementos importantes de cada tweet; c) Filtrado de
elementos poco relevantes, o ruido; y d) Clasificación de cada publicación basado en las
características obtenidas en etapas previas.
Los resultados obtenidos nos muestran que la introducción de un diccionario de lexicones
incrementó el número de términos que pueden ser considerados para la clasificación. Así
mismo, el uso de este diccionario al cual se le aumento nuevos términos permitió incrementar
la tasa de clasificación en un 0,75%. Finalmente, gracias a estas técnicas de análisis
de sentimiento, es posible explotar el contenido de redes sociales de manera que puedan
servir a las corporaciones para la toma de decisiones, especialmente de servicio a sus usuarios. |
---|