DETECCIÓN DE ANOMALÍAS EN SERIES DE TIEMPO FINANCIERAS USANDO APRENDIZAJE PROFUNDO
Contenido principal del artículo
Resumen
La detección de anomalías en series de tiempo es importante porque permite identificar patrones y tendencias que no son evidentes a simple vista y que pueden ser indicativos de problemas o riesgos, y que, en el caso financiero, puede representar serios desajustes económicos. La detección de anomalías se realiza usualmente mediante modelos estadísticos que capturan tendencias, estacionalidad y niveles en datos de series de tiempo. Cuando los datos nuevos difieren demasiado del modelo, se indica una anomalía o una falla del modelo. En este artículo, se describe un sistema automatizado para detección de anomalías en series de tiempo, usando algoritmos basados en aprendizaje profundo. Para el desarrollo de la investigación se usaron datos del comportamiento del índice de precios al consumidor, registrados mensualmente en nuestro país entre los años 1950 hasta agosto del 2022 por el Banco Central de Venezuela. Para la construcción del modelo de aprendizaje profundo se implementó una versión unidimensional del autocodificador U-Net. Se lograron resultados satisfactorios, alcanzando una precisión de 94,6 % en la detección de las anomalías.
Detalles del artículo
Citas
Bakumenko, A. y Elragal, A. (2022). Detecting anomalies in financial data using machine learning algorithms. Algorithms. Systems, 10, 130. Disponible en: https://doi.org/10.3390/systems10050130
Banco Central de Venezuela (01 de agosto de 2022). Índice General de Precios al Consumidor, Área Metropolitana de Caracas, Serie desde 1950, (Base: diciembre 2007=100). Disponible en: https://www.bcv.org.ve/estadisticas/consumidor
Bengio, Y., Goodfellow, I., y Courville, A. (2016). Deep learning. MIT Press.
Borges, H., Reza, A., y Masseglia, F. (2021). Anomaly detection in time series. Transactions on Large-Scale Data-and Knowledge-Centered Systems L, LNCS TLDKS-12930, 46-62. Lecture Notes in Computer Science. Disponible en: https://doi.org/10.1007/978-3-662-64553-6_3
Caicedo Palacio, M. (2018). Análisis de las series de tiempo del IPC en la predicción de la inflación en Colombia [Tesis de grado]. Universidad del Valle Facultad de Ciencias Naturales y Exactas.
Chollet, F. (2018). Deep learning with Python. Manning Publications Co.
Crépey, S., Lehdili, N., Madhar, Y., y Thomas, M. (2022). Anomaly detection on financial time series by principal component analysis and neural networks. arXiv:2209.11686v1 [q-fin.ST].
Hinton, G., y Salakhutdinov, R. (2006). Reducing the dimensionality of data with neural networks. Science, 313(5786), 504-507.
Korczak, J., y Marcin, R. (2017). Deep learning for financial time series forecasting in A-Trader system. Proceedings of the Federated Conference on Computer Science and Information Systems, 905–912. https://doi.org/10.15439/2017F449
León Anaya, L., Landassuri Moreno, V., Orozco Aguirre, H., y Quintana López, M. (2018). Predicción del IPC mexicano combinando modelos econométricos e inteligencia artificial. Revista Mexicana de Economía y Finanzas. https://doi.org/10.21919/remef.v13i4.342
López-Avila, L., Acosta-Mendoza, N., y Gago-Alonso, A. (2019). Detección de anomalías basada en aprendizaje profundo: Revisión. Revista Cubana de Ciencias Informáticas. Disponible en: http://rcci.uci.cu
Navon, A., y Keller, Y. (2017). Financial time series prediction using deep learning. arXiv:1711.04174v1 [eess.SP].
Pavithrasv, A. (2020). Timeseries anomaly detection using an autoencoder, Keras. Disponible en: https://keras.io/examples/timeseries/timeseries_anomaly_detection/
Quilis, E., y Frutos Vivar, R. (1999). Características inflacionarias de la economía española. Un análisis ARMA vectorial. Instituto de Estudios Fiscales, Papel de Trabajo, 9/99.
Ronneberger, O., Fischer, P., y Brox, T. (2015). U-Net: Convolutional networks for biomedical image segmentation. Medical Image Computing and Computer-Assisted Intervention (MICCAI). Disponible en: https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/
Schaffer, A., Timothy, A., y Pearson, S. (2021). Interrupted time series analysis using autoregressive integrated moving average (ARIMA). BMC Medical Research Methodology. https://doi.org/10.1186/s12874-021-01235-8
Schmidl, S., Wenig, P., y Papenbrock, T. (2022). Anomaly detection in time series: A comprehensive evaluation. Proceedings of the VLDB Endowment, 15(9). https://doi.org/10.14778/3538598.3538602
Wei, Y., Jang-Jaccard, J., Wen Xu, F., Camtepe, S., y Boulic, M. (2022). LSTM-Autoencoder based anomaly detection for indoor air quality time series data. arXiv:2204.06701v1 [cs.LG]. Disponible en: https://doi.org/10.48550/arXiv.2204.06701
Yan, W. (2020). Computational methods for deep learning. Springer, Texts in Computer Science. https://doi.org/10.1007/978-3-030-61081-4_4
Zhou, H., Xuan Zhang, K., Wu, G., y Yazidi, A. (2022). Contrastive autoencoder for anomaly detection in multivariate time series. Information Sciences, 610, 266-280.