El MIT ha creado una nueva herramienta para predicciones

105

Científicos del MIT (el Instituto Tecnológico de Massachusetts) acaban de presentar una herramienta que permite que usuarios sin experiencia puedan manejar complicados sistemas de inteligencia artificial como los que se usan hoy en día para pronosticar la evolución de la bolsa, el tiempo o la probabilidad de desarrollar enfermedades.

Las herramientas predictivas más fiables que tenemos en la actualidad parten de secuencias de datos que se obtienen de observaciones que realizamos durante un espacio de tiempo determinado. Cuando se monitorea la evolución de la enfermedad de un paciente o el flujo de ventas de un producto en un supermercado se obtienen una montaña de datos que cuando se procesan permiten realizar una estimación de lo que puede suceder a continuación. Esos datos cada vez se obtienen en mayores cantidades y por tanto son más difíciles de procesar que nunca, por eso en el siglo XXI utilizamos complejos algoritmos de aprendizaje automático que realizan los cálculos por nosotros.

Según los investigadores del MIT, su nueva herramienta consigue simplificar aún más está tarea y nos permite realizar nuestras propias predicciones sin tener que pasar por el proceso de aprendizaje de esta tecnología. El nuevo sistema, dicen sus creadores, es más preciso y eficiente que otros más avanzados cuando se trata de predecir valores futuros y rellenar vacíos de información dentro de una cadena de datos.

La nueva herramienta se llama tspDB (base de datos de predicción de series temporales) y permite emplear un nuevo algoritmo de predicción sobre una base de datos de series temporales ya existente. La base del nuevo algoritmo es otro anterior llamado SSA (análisis del espectro singular) que fue creado por el mismo equipo hace cuatro años. Este potente algoritmo es capaz de corregir y sustituir los valores que faltan dentro de una serie de datos y pronosticar series temporales únicas.

El reto que se ha propuesto el equipo ahora es hacer que ese algoritmo funcione también en series temporales con variables múltiples. Estos conjuntos de datos multivariantes en el caso, por ejemplo, de un meteorólogo serían los que se obtienen con las variaciones que ha habido durante un tiempo determinado en la temperatura, el punto de rocío o el movimiento de las nubes. La solución que ha encontrado el equipo del MIT consiste en apilar las distintas matrices de datos únicas y tratarlas como si fueran una sola matriz mucho más grande (mSSA) sobre la que se puede aplicar el SSA.

Los investigadores aseguran que el sistema resultante es realmente efectivo en predicciones basadas en datos de series temporales multivariantes. “Aunque los datos de las series temporales sean cada vez más complejos, este algoritmo puede captar eficazmente cualquier estructura de las series temporales. Parece que hemos encontrado la lente adecuada para observar la complejidad del modelo de datos de series temporales”, afirma el investigador principal del proyecto, Devavrat Shah.

El equipo ha calculado que un usuario que haya instalado el tspDB sobre una base de datos ya existente, puede realizar una consulta de predicción en unos 0,9 milisegundos. Los investigadores aseguran que esto permitiría que en solo unos minutos cualquiera sea capaz de predecir los precios futuros de las acciones aunque le falten algunos de los datos. Además, el equipo afirma que el sistema ofrece los resultados en intervalos de confianza que incorporan un grado de incertidumbre de las predicciones en su toma de decisiones. Algo que, según dicen, es de gran ayuda para los no iniciados en este tipo de sistemas.

El equipo está trabajando ya en mejorar la funcionalidad y la facilidad de uso del sistema y están buscando nuevos algoritmos que sean compatibles. Uno de sus objetivos es poder permitir añadir cambios puntuales en el comportamiento de las series de datos y que el sistema los detecta automáticamente para incluirlos en sus predicciones. “Nuestro mayor objetivo es conseguir que tspDB sea un éxito en forma de sistema de código abierto ampliamente utilizable”, afirma Shah. “Los datos de las series temporales son muy importantes, y este es un hermoso concepto para construir funcionalidades de predicción directamente en la base de datos. Nunca se ha hecho antes, y por eso queremos asegurarnos de que el mundo lo utilice”.

EL CONFIDENCIAL (29/03/2022)

Más información aquí

Si te resultó útil...Share on Facebook
Facebook
Tweet about this on Twitter
Twitter
Share on LinkedIn
Linkedin
Email this to someone
email