Navarro-Vega et al. 3
Rev. Amaz. Digit. 1(2): e195 (2022). e-ISSN: 2810-8701
en comparación con LR y VAR utilizando las aplicaciones de WEKA y Orange, que permitió
predecir los patrones potenciales de los efectos de la COVID-19 en la India.
El Perú, se encamina a combatir con esta pandemia que estamos librando, la COVID-19, este virus
mortal para las personas, el cual no mide condición social, raza, ni situación económica. En la
actualidad, donde tenemos un mundo globalizado, y con el avance de la alta tecnología y de
conocimiento especializado, se requiere elaborar un proyecto tecnológico para poder combatir la
COVID-19. Como se conoce la COVID-19 atacó diferentes departamentos de nuestro Perú, el
sector salud, SALUD DIRESA Madre de Dios, cada vez es más importante el procesamiento de
datos de personas que se contagiaron con COVID-19 en sectores públicos y privados mediante
herramientas digitales. Y cada vez son más variadas las fuentes y su naturaleza. Se tratan datos
semiestructurados de registros médicos que fueron digitalizados, de historias clínicas.
En este contexto, la presente investigación tiene como finalidad realizar una análisis de los datos
publicados por el Ministerio de Salud (MINSA) para obtener insights y luego proponer un
modelo de pronóstico para los casos positivos de COVID-19 utilizando mediante el uso de
técnicas de deep learning en el departamento de Madre de Dios, la técnica a usar será LSTM,
posteriormente para un mejor análisis se realizará un mapa sectorizado con el pronóstico de casos
positivos de COVID-19, clasificado por categorías en función al número de casos positivos (leve,
moderada y severa). Según los resultados obtenidos las autoridades y funcionarios de la
Dirección Regional de Madre de Dios tomarán las mejores decisiones para aplicar estrategias de
prevención y contener el aumento del número de pacientes con el nuevo coronavirus.
2. Materiales y métodos
En la Tabla 1 se observa diferentes artículos científicos revisados y analizados, cada artículo tiene
el tipo de metodología utilizada para pronosticar datos recopilados de la plataforma de datos
abiertos proporcionados por el Ministerio de Salud de cada país, y el porcentaje de efectividad
obtenido con cada modelo presentado. En el primer artículo, Khakharia et al. (2021) proponen
utilizar nueve técnicas de Machine Learning: Auto-Regressive Moving Average (ARMA), Auto-
Regressive Integrated Moving Average (ARIMA), Support Vector Regressor (SVR), Linear
Regressor polynomial (LRP), Bayesian Ridge Regression (BRR), Li- ear Regression (LR), Random
Forest Regressor (RFR), Holt-Winter Exponential Smoothing (HW), and Extreme Gradient Boost
Regressor (XGB), donde ARMA con el país de Ethiopia se tuvo mayor precisión llegando a
99,93%.
En el segundo artículo, Sujath et al. (2020) proponen tres técnicas: Linear regression (LR),
multilayer perceptron (MLP), and VAR, donde se puede visualizar que los tres métodos
utilizados obtuvieron el mismo porcentaje de efectividad, 95%. En el tercer artículo, Kafieh et al.
(2021) proponen tres técnicas: multilayer perceptron, random forest y different versions of long
short-term memory (LSTM) y cuatro métricas Including Mean Average Percentage Error
(MAPE), Root Mean Square Error (RMSE), Normalized RMSE (NRMSE) y R2. El mejor
desempeño se encontró para una versión modificada de LSTM, denominada M-LSTM (modelo
ganador), para pronosticar la trayectoria futura de la pandemia en los países mencionados. Se
puede concluir que el método MLP está dando mejores resultados de predicción que los métodos
LR y VAR.
En el cuarto artículo, Fanelli y Piazza (2020) analizan la dinámica temporal del brote de la
enfermedad por coronavirus 2019 en China, Italia y Francia en la ventana de tiempo del 22/01 al
15/03/2020, en donde sus experimentos estiman que 2500 unidades de ventilación deberían
representar una cifra justa para el requisito máximo que deben considerar las autoridades
sanitarias de Italia para su planificación estratégica. En el quinto artículo, Mendieta M. (2020) se
propone dos técnicas: Modelos Lineales (MCL) y no lineales (MCNL). Se pudo ver que el método
MCNL, obtuvo un 96,3 % de efectividad en el tema de predicción. En el sexto artículo, Garrido et
al. (2022) proponen un modelo: Susceptible, Expuesto, Infectado y Recuperado (SEIR). Se puede