Twitter, una fuente alternativa de datos para modelos epidemiológicos - Lilia Ramírez | La Crónica de Hoy
Facebook Twitter Youtube Jueves 29 de Diciembre, 2016
Twitter, una fuente alternativa de datos para modelos epidemiológicos | La Crónica de Hoy

Twitter, una fuente alternativa de datos para modelos epidemiológicos

Lilia Ramírez

Una de las misiones más importantes de los organismos encargados de diseñar las políticas de salud pública es la de instaurar mecanismos eficaces para detectar de manera oportuna los brotes de enfermedades infecciosas para combatirlos de forma inmediata. Un monitoreo eficaz del comportamiento que presentan las apariciones de nichos de infección pueden ser determinantes para disminuir el impacto del brote y evitar el surgimiento de pandemias.
Las medidas de control epidémico se apoyan fuertemente en la información recolectada por el sistema de vigilancia sanitario. En el caso que vamos a exponer, esa información se refiere al número de casos causados por el agente infeccioso de interés. En diversos países estos sistemas han reportado a lo largo del tiempo dos tipos de información. El primero se refiere al número de pacientes que por sintomatología son sospechosos de ser contagiados por el agente. Esta información es usualmente registrada por médicos, centros de salud y hospitales. El segundo tipo de información se refiere a los casos que, después de haber sido examinados con pruebas de laboratorio, se confirman como causados por el agente infeccioso. En algunos esquemas de vigilancia el conteo de ambos tipos de casos se acompaña con información sociodemográfica, tales como el género y el grupo de edad.
La información confiable y actualizada (en tiempo real) es indispensable para apoyar la toma de decisiones y combatir la propagación de infecciones. Sin embargo,una de las dificultades a las que se enfrentan las instituciones de salud es la relacionada a la actualidad de los datos. El tiempo que tarda en generarse la información puede ser de varias semanas, y conforme avanza el tiempo la evaluación pierde vigencia y se reduce la eficacia con la que pueden intervenir los organismos de salud para detener los brotes. Ante este panorama, en años recientes se ha buscado el uso de fuentes alternativas de información, como la generada por las redes sociales.
Desde 2004 he trabajado en modelos estocásticos para la dispersión de epidemias, y desde 2009 con Yulia Gel, de la Universidad de Texas en Dallas, he buscado el desarrollo de modelos que utilicen fuentes de información alternativas, como las redes sociales, que complementen la información proveniente de los sistemas de vigilancia.
El objetivo es realizar predicción del número de casos futuros y evaluar el impacto de medidas de control tales como vacunación y cierre temporal de escuelas en una zona.
Con el apoyo de herramientas estadísticas y computacionales, realizamos un modelo ad hoc a las características generales de una comunidad específica para la detección de influenza. Nuestra investigación se realizó en la región de Peel, en Ontario, Canadá, que tiene una población de un millón y medio de habitantes. Como parte de nuestro estudio se construyó una red de contactos individuales. Estos contactos modelan el tipo de contactos que pueden resultar en la transmisión de la infección entre las personas y se creó según las características sociodemográficas de la región y la información de las escuelas en el área y su matrícula.
Por otro lado, contamos con la información de los datos confirmados que reportan las autoridades de salud, datos que, como hemos explicado, no son reportados al día ya que se obtienen luego de realizar pruebas de laboratorio. Si las instituciones estuvieran interesadas en hacer la planeación de acciones sanitarias para las próximas semanas, entonces no contaríamos con la información en tiempo real para poner en marcha nuestro modelo estocástico de predicción.
Con el fin de subsanar la falta de información que usualmente se tiene para las dos últimas semanas, usamos la información de las redes sociales, en particular de Twitter, para obtener un aproximado del número de casos que hay en el periodo no observado.
La información de Twitter que se utiliza es la frecuencia en los mensajes, originados en la región, que están relacionados con influenza. No es necesario que sean manifestaciones abiertas de la enfermedad, menciones tales como “tengo x síntomas de influenza”, sino tan solo publicaciones en las que los usuarios incluyen palabras clave relacionadas que pueden referirse a sinónimos  de influenza (flu, gripe, etc.), síntomas, o también a medicamentos para aliviar sus síntomas. Debido a que esta fuente de información pretende medir la actividad de la influenza, pero no son casos confirmados, se relaciona más apropiadamente a los casos sospechosos o sintomáticos, también denominados ILI (Influenza like Illness).
Nosotros proponemos una metodología que utilice la información oficial y la de la actividad de la influenza contenida en mensajes de Twitter para modelar el número de casos confirmados hasta la última hora. Realizado esto, entonces se puede utilizar el modelo estocástico de predicción bajo un escenario libre o con control epidémico.
En nuestro estudio hemos visto que sí hay una relación fuerte entre la información alternativa obtenida en las redes sociales y los casos confirmados de influenza, sin embargo hay que anotar que en algunos estudios, que buscan relacionar la actividad de los mensajes de Twitter con algún evento en particular, se ha observado que el volumen de los mensajes es propenso a seguir algún otro tipo de variable, tal como lo es la misma actividad de los mensajes en Twitter (autoexcitación). Con el fin de combatir esta situación, se debe considerar que la relación entre Twitter y la actividad de la influenza es dinámica y como tal debe ser modelada.

 

 

 

* La doctora Lilia Leticia Ramírez es investigadora del Centro de Investigación en Matemáticas, AC (Cimat), donde hizo una Maestría en Estadística. Se doctoró en Estadística en 2008, en la Universidad de Waterloo, en Canadá, donde también realizó un posdoctorado. También ha sido investigadora del Instituto Tecnológico Autónomo (ITAM). Sus líneas de interés son los modelos epidémicos aleatorios, inferencia en redes aleatorias, estadística computacional y modelación estadística de problemas de medio ambiente y social.

 

 

Imprimir

Comentarios

Columnas anteriores