- Ampliaron la capacidad de un servidor donado por la DGTI para procesar la información de 10 millones de usuarios
- Sus publicaciones pueden consultarse en www.uv.mx/larsi y en la cuenta de Twitter: @Piniisima
David Sandoval Rodríguez
06/02/19, Xalapa, Ver.- El Laboratorio para el Análisis de Información a través de Redes Sociales en Internet (LARSI), perteneciente al Centro de Estudios de Opinión y Análisis (CEOA) de la Universidad Veracruzana (UV), inicia este año con el análisis de la actividad de 10 millones de usuarios y otras tareas relacionadas con la ciencia de datos.
Carlos Adolfo Piña García y Francisco Ortega Rivera, coordinador general y responsable de Seguridad y Administración del LARSI, respectivamente, hicieron referencia al proyecto “Sistema de monitoreo en redes sociales para detectar y prevenir brotes de violencia en México”, que fue ganador del “Premio a la investigación interdisciplinaria en torno al Plan de Restructuración Estratégica del Conacyt (2018-2024)”, promovido por la misma UV.
En el LARSI no sólo se trabajará en este rubro, también en un mapa de la actividad en Twitter a nivel nacional porque se tienen consideradas ciertas regiones, en particular las principales ciudades del país y su zona central, que coinciden con la capacidad de conectividad a Internet, es decir, que existe una correlación entre la actividad en Twitter con la posibilidad de conectarse a Internet.
“No sólo hemos participado como LARSI en actividad de la República Mexicana, sino también con la Ciudad de México, dentro del Hack CDMX, que estuvo orientado a la generación de proyectos que contribuyan a evitar hechos de tránsito o mejorar el servicio de transporte público utilizando datos abiertos”, explicó Piña García.
Detectaron dónde ocurrían más accidentes y trabajaron con bases de datos abiertas que liberó el gobierno de la ciudad y las publicaciones en redes sociales, con el fin de generar acciones de impacto social que beneficien al público y al entorno, tratando de resolver problemas que son de gran interés para la ciudadanía.
Por otro lado, han comenzado a monitorear una base de datos cercana a los 10 millones de tuits, una cantidad masiva de información que requiere de un servidor altamente capacitado y con características específicas.
“Para trabajar con esos 10 millones de tuits se requiere de un procesamiento de información muy vasto y por tal motivo la Dirección General de Tecnologías de Información (DGTI) nos donó un servidor que hemos adaptado y mejorado para resolver los retos a nivel informativo”, reconoció el investigador.
En ese sentido, Ortega Rivera precisó que con el apoyo de la DGTI y el servidor donado, será posible manejar un gran volumen de información que representa el inicio de actividades del LARSI a esta escala.
De igual manera, enfatizó la importancia de fortalecer la seguridad del dispositivo, “nos preocupa la seguridad porque los tuits contienen información personal de usuarios, así como su georreferencia y otros datos; nosotros los protegemos para que pueda hacerse un análisis y una interpretación adecuada que permita a la sociedad tomar decisiones”.
Con recursos propios se adquirió memoria RAM para el servidor que actualmente es de 96 Gigabytes (GB), porque al principio ésta era de 32 GB, “tuvimos que comprar dos veces la capacidad de memoria que originalmente teníamos con la donación, logrando así cargar la información y procesarla”, añadió Francisco Ortega.
Refirió que la optimización del servidor, así como su seguridad, representa un trabajo constante que se monitorea a diario y en el que se incluye la realización de pruebas en ciertos parámetros para mejorar la configuración y los usos de la memoria, además del procesamiento.
Recordó que ninguna tecnología es invulnerable, por tal razón se monitorea a diario la seguridad y en consecuencia a que se han incrementado los ataques a servidores.
“En este momento nuestro servidor no es público pero en algún momento, con las condiciones de operación adecuadas, será posible que los interesados accedan a la información”, señaló.
Al día de hoy han publicado información en la cuenta de Carlos Piña en Twitter: https://twitter.com/Piniisima (@Piniisima) y en el sitio www.uv.mx/larsil, página oficial del laboratorio dentro del servidor institucional.
Se han hecho publicaciones sobre algunos de los eventos más relevantes para los usuarios de las redes sociales, como han sido las explosiones de ductos de Petróleos Mexicanos (Pemex) y sucesos internacionales como la situación política de Venezuela, ello mediante las imágenes conocidas como “nubes de palabras”.
Para este año se comenzará a trabajar con la plataforma Instagram con el propósito de publicar información en forma de imágenes. “En 2019 trataremos de hacer grupos de imágenes, en el sentido de agrupar a Londres, Ciudad de México o Nueva York dentro de la categoría de ciudades, por ejemplo”, precisó Carlos Piña.
“Ello posibilitará a futuro que, si existe un #pemex, por ejemplo, y se están mencionando conceptos como explosiones o ‘pipas’, se agrupen en un campo y podamos establecer de qué está hablando la gente en Instagram, qué se publica más bajo una etiqueta”, abundó.
El académico invitó a los estudiantes universitarios interesados en la ciencia de datos a sumarse al LARSI como prestadores de servicio social o a través de un trabajo recepcional, en particular aquellos que cursan las licenciaturas en Informática, Sistemas Computacionales, Geografía, Estadística y Matemáticas.
Piña García destacó además el compromiso de la actual administración universitaria con respecto a brindar apoyo en la medida de lo posible al LARSI, con base en los resultados obtenidos como el premio interdisciplinario y su participación en las elecciones de 2018 como parte del comité organizador del tercer debate presidencial.
“En la Universidad Veracruzana estamos capacitados para enfrentar retos nacionales e internacionales, como lo han demostrado estas acciones”, comentó el investigador.
Categorías: Principales, Tecnología