Asher & Lyric

Sciling ayuda a destapar los problemas de la economía colaborativa mediante Procesamiento de Lenguaje Natural

Asher y Lyric Fergusson son dos bloggers e investigadores especializados en viajes a los que les encanta viajar por el mundo con sus dos hijos pequeños y compartir contenido útil para otros viajeros, como guías de viaje, consejos y estudios de investigación. Sus artículos e investigaciones se han presentado en medios tan prestigiosos como The New York Times, The Guardian, CNN, Forbes, National Geographic y Lonely Planet, entre muchos otros.

 

En septiembre de 2017 experimentaron dos pesadillas consecutivas de Airbnb que los dejaron en las calles de París con un bebé de 10 meses asustados, vulnerables y sin ningún lugar adonde ir. Esto los llevó a preguntarse si Airbnb era seguro, por lo que a la vuelta decidieron analizar más de 1.000 evaluaciones de huéspedes para descubrir hasta qué grado era seguro reservar un alojamiento a través de la plataforma y cuáles eran los problemas que más se repetían.

Los resultados de su estudio tuvieron tal repercusión mediática que ASIS International y el departamento de investigación del Colegio John Jay de Justicia Criminal de la City University de Nueva York se ofrecieron a apoyar y financiar una investigación más exhaustiva sobre las posibles amenazas a la seguridad ocultas tras dos de los casos de éxito más polémicos de la economía colaborativa, Airbnb y Uber. Este estudio más intenso sobre los problemas ocultos de ambas compañías requeriría analizar los tweets de sus cuentas de atención al cliente. Pero Asher sabía que clasificar millones de conversaciones a mano era una tarea titánica.

Sobre el cliente:

El blog de Asher y Lyric Fergusson, en sus propias palabras, “ayuda a cientos de miles de personas cada mes a mantenerse seguras, saludables y felices en casa y mientras viajan”. El departamento de investigación del John Jay Collegue y la asociación ASIS están comprometidos con el avance en los problemas más importantes que enfrenta el mundo de hoy en campos como la seguridad pública y la justicia social.

www.asherfergusson.com

Haz click aquí para obtener una versión en PDF de nuestros casos de éxito.

El reto

Las redes sociales constituyen, cada vez más, un entorno donde manifestar sentimientos, opiniones, quejas y denunciar comportamientos abusivos. Este es el caso de Twitter, donde los usuarios se han percatado de que escribir un tweet citando a la marca y expresando su problema es una vía directa para que la empresa se ponga en contacto con uno a la vez que un medio para poner sobre aviso a otros usuarios.

Teniendo esto en cuenta, Asher llegó a la conclusión de que una muy buena manera de descubrir los problemas más frecuentes a los que se exponen los usuarios de Airbnb y Uber era analizar los tweets de las cuentas de atención al cliente de estas empresas. Dado el volumen de datos que tendría que procesar, se dio cuenta de que la única opción era automatizar esta tarea mediante el uso de Inteligencia Artificial y, más concretamente, de técnicas de Procesamiento del Lenguaje Natural, especialidad que forma parte del core de Sciling.

Twitter es una de las redes sociales más populares a nivel mundial. Esto la convierte en una de las mayores fuentes de información disponible en Internet.  No obstante, existen ciertas peculiaridades de esta red social que dificultan la extracción de conocimiento. “Además del alto volumen de información, la corta longitud de los tweets supone un desafío. Como los microtextos no proporcionan suficientes ocurrencias de palabras, los métodos de clasificación tradicionales se ven muy limitados. Si no se utilizan otras técnicas más novedosas los resultados obtenidos no alcanzarán el nivel de precisión requerido” comenta Vicent Alabau, Director de Operaciones de Sciling.

Visión estratégica:

Además de asegurar una tasa de acierto mayor, el proceso de implementación sugerido por Sciling permitió categorizar los más de dos millones de Tweets que acumulaban en conjunto las cuentas de atención al cliente de Airbnb y Uber en el menor tiempo posible y con el menor esfuerzo posible.

Nuestra solución

Tras cuatro iteraciones del proceso se ha obtenido un clasificador que permite establecer los problemas más recurrentes para los usuarios de Airbnb y Uber. Pero no solo esto, con la información resultante también es posible realizar estudios sobre la aparición de determinadas palabras o analizar la evolución de ciertos problemas a lo largo del tiempo.

Pero las posibilidades de este tipo de algoritmos van mucho más allá de la obtención de información relevante para el ámbito de la seguridad. Los investigadores del John Jay College comentan lo siguiente en su estudio: “Examinar los datos de las redes sociales puede ser un enfoque proactivo para evitar la pérdida de reputación. La pérdida de reputación es difícil de cuantificar, pero es una preocupación primordial para cualquier organización. La organización corre el riesgo de perder no solo al cliente que tuvo la mala experiencia, sino también a todas las personas que leyeron el tweet.”

“La tecnología desarrollada es útil para cualquier negocio orientado a cliente. No solo permite discernir qué problemas tienen los usuarios de un determinado servicio, sino que también hace posible que cualquier empresa desarrolle una estrategia customer centric al realizar análisis de sentimiento de sus clientes, anticiparse a sus problemas, descubrir tendencias y conocer su nivel de satisfacción, entre otras muchas aplicaciones”, indica Antonio Salas, Director de Marketing de Sciling.

420.000

Tweets de Airbnb analizados

1,8 M

Tweets de Uber analizados

78%

De precisión

El perfil investigador del personal de Sciling me impresionó y me dio seguridad de cara a que sabrían cómo conseguir que este proyecto fuera un gran éxito, a pesar de los obstáculos que pudiéramos encontrar en el camino.

Asher FergussonAsher & Lyric

Con la ayuda de la inteligencia artificial, se pueden analizar grandes cantidades de datos de redes sociales de manera eficiente y efectiva.

Chelsea A. BinnsAssistant Professor John Jay College of Criminal Justice

El proceso de implementación

Para poder alcanzar la máxima precisión posible a pesar de las limitaciones impuestas por los breves textos que caracterizan al microblogging, se estableció una metodología de trabajo basada en un proceso cíclico que afinaba el algoritmo con cada nueva pasada. 

El proceso comienza con una fase de descubrimiento en la que se analizan manualmente una centena de tweets a fin de generar un conjunto inicial de categorías. A continuación, y haciendo uso de las categorías detectadas en la fase anterior, se etiquetan unos 1.500 tweets. Estos constituyen el conjunto de datos a partir del cual el algoritmo aprenderá a asignar automáticamente categorías al resto en una fase posterior, conocida como fase de entrenamiento.  Una vez entrenado el algoritmo, este se aplica a todo el conjunto de datos a fin de categorizarlo por completo.

El proceso podría haber acabado aquí. No obstante, Sciling introdujo un par de pasos adicionales que debían realizarse de manera cíclica hasta alcanzar la precisión deseada y que produjeron muy buenos resultados. Una vez categorizados todos los tweets, se identifican aquellas categorías en las que algoritmo acierta menos por contar con menos datos y más ruido. Entonces, estos se validan a mano indicando únicamente si la categoría asignada es o no la correcta. Este proceso, mucho menos costoso en tiempo y recursos que el etiquetado manual de la fase previa, permite volver a entrenar el sistema y obtener mejores resultados en la siguiente iteración.

Tecnologías empleadas
1

Etiquetado de Datos Asistido por Aprendizaje Automático

Para agilizar el etiquetado de tweets
2

Clasificación Automática de Textos

Para asignar tweets a etiquetas
3

Aprendizaje Profundo

Como tecnología transversal

¿Por qué nosotros?

  • Las tecnologías de Procesamiento del Lenguaje Natural forman parte de nuestro core
  • Nuestro equipo de investigadores utiliza las tecnologías más punteras para resolver cualquier desafío operativo
  • Contamos con más de 15 años de experiencia en el desarrollo de proyectos relacionados con la investigación y aplicación de Aprendizaje Automático