Detección inalámbrica de frecuencia respiratoria utilizando señales Wi-Fi y aprendizaje automático
Jesús A. Armenta-García* ORCID: 0000-0002-3348-7906
Félix F. González-Navarro* ORCID: 0000-0002-9627-676X
Jorge E. Ibarra-Esquer* ORCID: 0000-0003-2636-5051
Jesús Caro-Gutiérrez* ORCID: 0000-0003-2467-5937
CIENCIA UANL / AÑO 26, No.121, septiembre-octubre 2023
DOI: https://doi.org/10.29105/cienciauanl26.121-3
RESUMEN
Es posible utilizar el Wi-Fi para la detección inalámbrica, con aplicaciones en la localización de interiores, reconocimiento de actividades, identificación de personas y en el monitoreo de signos vitales. Es por esto que en este trabajo se presenta cómo se puede utilizar el Wi-Fi para aplicaciones de detección inalámbrica, así como una metodología seguida para el desarrollo de un monitor de frecuencia respiratoria haciendo uso de señales Wi-Fi y aprendizaje automático, específicamente de un clasificador K-NN, obteniendo resultados satisfactorios, demostrando la aplicabilidad de dicha tecnología para la detección inalámbrica.
Palabras clave: CSI, aprendizaje automático, detección inalámbrica, Wi-Fi, monitoreo de frecuencia respiratoria.
ABSTRACT
It is possible to utilize Wi-Fi as a wireless sensing technology, having applications in indoor localization, activity recognition, human identification and monitoring vital signs. Therefore, in this paper we present how Wi-Fi can be used for wireless sensing applications such as the methodology followed to develop a breathing rate monitor using Wi-Fi signals and machine learning, specifically a K-NN classifier, obtaining satisfactory results, demonstrating the applicability of such technology in wireless sensing.
Keywords: CSI, Machine Learning, Wireless Sensing, Wi-Fi, Breathing Rate Monitoring.
WI-FI COMO TECNOLOGÍA DE DETECCIÓN INALÁMBRICA
La detección inalámbrica consiste en la medición de propiedades físicas de un objeto, persona o medio ambiente sin tener contacto físico con él por medio de la fijación de un sensor. Dadas sus características, las tecnologías de detección inalámbrica han sido un foco de atención en los últimos años, siendo los sistemas de grabación y reproducción de imágenes las más utilizadas. Sin embargo, existe una tecnología de mayor cobertura con millones de dispositivos en funcionamiento que puede usarse para la detección inalámbrica: el Wi-Fi.
Para hacer uso de dicha tecnología es necesario apoyarse en lo que se conoce como la información de estado del canal (CSI, por sus siglas en inglés), la cual es generada por los dispositivos de red para mitigar los efectos de la propagación multitrayecto (Halperin et al., 2010; para entender estos efectos véase la figura 1). En ésta puede observarse que la señal transmitida desde un transmisor (Tx) a un receptor (Rx) sufre de reflexiones con distintos elementos en la habitación, formando una superposición de señales desfasadas y atenuadas en Rx con relación a la señal original. Estos desfases y atenuaciones se ven reflejados en la CSI, representada por un número complejo cuya parte real corresponde a la amplitud y la parte imaginaria al desfase.
Las variaciones que se presentan en la amplitud y fase de la CSI son las que permiten obtener una descripción del comportamiento de la señal en presencia de objetos estacionarios o en movimiento. Dicho comportamiento, con apoyo de procesamiento de señales y aprendizaje automático, se puede caracterizar, logrando así la detección inalámbrica
Para el experimento realizado, la recolección de CSI se llevó a cabo utilizando una herramienta que opera bajo el estándar Wi-Fi 802.11n (mejor conocido como Wi-Fi 4), el cual hace uso del método de modulación multiplexación por división de frecuencia ortogonal (OFDM, por sus siglas en inglés), para el envío de información que divide el canal en 64 subportadoras, por lo que al recolectar el CSI en un instante, se tendrían 64 números complejos, uno por subportadora y con comportamiento distinto debido a la diferencia de frecuencias centrales.
En la actualidad, la CSI de una señal Wi-Fi ha sido utilizada para la localización en interiores combinando redes neuronales convolucionales para determinar la ubicación actual de una persona (Hoang et al., 2020); mientras que Narui et al. (2019) hicieron uso de la CSI y aprendizaje automático para el reconocimiento de actividades cotidianas. Por otra parte, Dinget al. (2020) la utilizaron para la identificación de personas combinando distintos métodos de aprendizaje profundo. Adicionalmente, Gu et al. (2021) desarrollaron un sistema para monitoreo de frecuencia respiratoria y cardíaca durante el sueño por medio de procesamiento digital de señales. Además, se ha utilizado aprendizaje automático para la identificación de una frecuencia respiratoria irregular (Khan et al., 2021) y para la detección de rangos de frecuencia respiratoria baja, normal y elevada (Ashleibta et al. 2021), ambos utilizando K-vecinos cercanos (K-NN por sus siglas en inglés).
METODOLOGÍA
Adquisición y procesamiento de señales Wi-Fi
Para demostrar la aplicabilidad de una señal Wi-Fi como tecnología de detección se desarrolló un sistema para el monitoreo de frecuencia respiratoria, para ello se contó con la participación de 17 personas del escenario de prueba mostrado en la figura 2, contando con dos miniPC Intel NUC equipadas con una tarjeta de red Intel 5300 cada una y haciendo uso de la herramienta Linux 802.11n CSI Tool (Halperin et al., 2011), la cual proporciona la CSI de 30 subportadoras por cada antena en Rx. Una miniPC actuaba como Tx, equipada con una antena omnidireccional enviando 25 paquetes de red por segundo a la miniPC que actuaba como Rx, equipada con tres antenas omnidireccionales y ambas operando en la banda de 5 GHz. Cada participante debía recostarse en la camilla por periodos de cinco minutos y sincronizar su respiración con el sonido de un metrónomo, cubriendo las frecuencias de 9, 12, 15, 18 y 21 respiraciones por minuto (RPM). Adicional a esto, se colocó un acelerómetro sobre el abdomen para obtener el valor de frecuencia respiratoria real.
Una vez llevado a cabo el proceso de recolección, las subportadoras fueron sometidos a una etapa de adecuación, haciendo separación en grupos de datos delimitados por ventanas de tiempo de 40 segundos y seleccionando únicamente diez para continuar con la adecuación con base en la varianza que presentaran en dicha ventana de tiempo, ya que se observó que, a mayor varianza, la cantidad de información que contenía la subportadora acerca de la respiración era mayor. A cada ventana se le aplicaba una serie de filtros digitales comúnmente para localizar la frecuencia respiratoria a partir de la señal Wi-Fi (filtro Hampel, filtro polinomial y filtro paso-bandas con frecuencias de corte de 0.1 y 0.4 Hz). El resultado del proceso de adecuación puede observarse en la figura 3, donde se comparan la señal original y la procesada.
De la señal ya adecuada es posible obtener una primera estimación de la frecuencia respiratoria realizando un análisis del espectro. Si bien puede resultar suficiente para su monitoreo, siendo la reportada en la bibliografía, la implementación de algoritmos de aprendizaje automático mejoraría el desempeño del sistema construido hasta ahora, ya que su implementación ha traído mejorías en aplicaciones de la informática médica y es una tendencia en la actualidad.
Etiquetado de los datos e implementación del aprendizaje automático
De la señal adecuada, que sería la de respiración, se extrae de cada subportadora una serie de características del dominio del tiempo (media, varianza, asimetría y curtosis), y del dominio de la frecuencia (frecuencia con mayor amplitud y desviación estándar del espectro), así como la media, desviación estándar y varianza de los coeficientes obtenidos con la transformada Wavelet. Estas características, junto con la primera estimación, son utilizadas para construir una observación que será enviada a un clasificador K-NN. Éste asignará a los datos una etiqueta asociada al rango de frecuencia respiratoria en RPM que corresponda a la señal. Los rangos en RPM, la etiqueta y el índice de clase, que es el valor que realmente asigna el clasificador, son los siguientes: 1 para frecuencias respiratorias menores a 10 RPM; 2 entre 11 y 13 RPM; 3 para valores entre 14 y 16 RPM; 4 entre 17 y 19 RPM, y 5 para toda aquella frecuencia respiratoria mayor a 20 RPM. Dichos rangos auxilian en la identificación de patrones regulares e irregulares de respiración.
Se dividió el conjunto de datos en dos particiones, estando la primera conformada por datos pertenecientes a 13 personas y la segunda por datos de otras cuatro personas. La primera corresponde a los datos que se utilizaron para el entrenamiento de un clasificador K-NN, cuyos parámetros de configuración fueron definidos utilizando optimización bayesiana, resultando en una k = 1, que corresponde a la cantidad de vecinos (observaciones) a considerar para selección de clase y distancia Hamming como métrica de distancia, mientras que la segunda fue utilizada para evaluar el clasificador, utilizando como métricas de desempeño la exactitud, sensibilidad, precisión y especificidad. Un resumen de la metodología expuesta desde la adquisición de los datos hasta la clasificación con K-NN se presenta en la figura 4.
Al evaluar el desempeño del clasificador K-NN se obtuvo una exactitud, sensibilidad, precisión y especificidad promedio de 99.2%, 97.9%, 98% y 99.5%, respectivamente, mientras que el desglose de desempeño por clase se presenta en la tabla I, en la que podemos observar que la Clase 1 presentó los valores de exactitud, precisión y especificidad más bajos; sin embargo, se mantienen por arriba de 95%. Los valores de las métricas obtenidas para las cinco clases posibles nos muestran que los resultados proporcionados por el clasificador son confiables y que los atributos extraídos para cada observación verdaderamente caracterizan su respectivo rango de frecuencia respiratoria. Para asegurarnos de este último enunciado se aplicó la incrustación de vecinos estocásticos distribuidos en t (t-SNE, por sus siglas en inglés), un método de visualización de datos de altas dimensiones, con la finalidad de observar agrupaciones de los datos en caso de pertenecer a una misma clase, es decir, a un mismo rango de frecuencia respiratoria, en dos dimensiones.
El resultado del método de visualización se presenta en la figura 4, en donde es posible observar que se forman agrupaciones de datos de una misma etiqueta de clase en una misma región del plano. Estas agrupaciones muestran que observaciones que pertenecen a un mismo rango de frecuencia respiratoria son similares entre sí, pero visualmente distintas a observaciones pertenecientes a un rango diferente. Es por esto que, a partir del análisis de la figura obtenida por t-SNE, se comprende por qué K-NN obtiene valores de desempeño por arriba de 97%, ya que al ser un clasificador basado en instancias (observaciones), su desempeño está altamente relacionado con la similitud entre observaciones pertenecientes a una misma clase y a la diferencia entre observaciones de distintas clases de acuerdo a una métrica de distancia.
CONCLUSIÓN
El uso de señales Wi-Fi como tecnología de detección inalámbrica ha demostrado resultados prometedores en las áreas de localización de interiores, reconocimiento de actividades, identificación de personas y, como quedó demostrado en este artículo, al combinar los métodos convencionales para estimación de frecuencia respiratoria con métodos de aprendizaje automático se obtienen resultados satisfactorios para su monitoreo, alcanzando una exactitud promedio de 99.2%. Sin embargo, una limitante que se presenta al utilizar la herramienta de recolección Linux 802.11n CSI Tool es que resulta obligatorio utilizar las tarjetas de red Intel 5300 y, por ende, una computadora como dispositivo de red en lugar de utilizar la infraestructura ya instalada.
El uso de esta tecnología para tales aplicaciones aún está en sus inicios. Al tratarse de una señal electromagnética, es susceptible a perturbaciones y éstas pueden afectar de forma negativa el desempeño de los sistemas basados en la CSI, es por ello que para futuras investigaciones es necesario considerar diversos escenarios y fuentes de ruido. Cabe destacar que la metodología presentada obtuvo un alto desempeño aun a pesar de estar en un escenario en el que existen múltiples redes Wi-Fi en operación, las cuales pueden ser vistas como una fuente de ruido electromagnético.
AGRADECIMIENTOS
Agradecemos al Conacyt y a la 22a Convocatoria Interna de Apoyo a Proyectos de Investigación 2020 de la UABC por su apoyo en el desarrollo de esta investigación.
* Universidad Autónoma de Baja California, Baja California, México.
Contacto: fernando.gonzalez@uabc.edu.mx
REFERENCIAS
Ashleibta, A.M., et al. (2021). Non-Invasive RF Sensing for Detecting Breathing Abnormalities Using Software Defined Radios. IEEE Sensors Journal. 21(4):5111-5118. Disponible en: https://doi.org/10.1109/JSEN.2020.3035960
Ding, J., Wang, Y., y Fu, X. (2020). Wihi: Wi-Fi Based Human Identity Identification Using Deep Learning. IEEE Access. 8:129246-129262. Disponible en: https://doi.org/10.1109/ACCESS.2020.3009123
Gu, Y., et al. (2021). Wital: WiFi-based Real-time Vital Signs Monitoring During Sleep. TechRxiv. Disponible en: https://doi.org/10.36227/techrxiv.14381750. v1
Halperin, D., et al. (2010). Predictable 802.11 Packet Delivery from Wireless Channel Measurements. SIGCOMM Comput. Commun. Rev. 40(4):159-170. Disponible en: https://doi.org/10.1145/1851275.1851203
Halperin, D., et al. (2011). Tool Release: Gathering 802.11n Traces with Channel State Information. ACM SIGCOMM CCR. 41(1):53.
Hoang, M.T., et al. (2020). A CNN-LSTM Quantifier for Single Access Point CSI Indoor Localization, CoRR, abs/2005.0. Disponible en: https://arxiv.org/abs/2005.06394
Khan, M.I., et al. (2021). Tracking vital signs of a patient using channel state information and machine learning for a smart healthcare system. Neural Computing and Applications. Disponible en: https://doi.org/10.1007/s00521-020-05631-x
Narui, H., et al. (2019). Domain Adaptation for Human Fall Detection Using WiFi Channel State Information. Precision Health and Medicine Studies in Computational Intelligence. Pp. 177-181. Disponible en: https://doi.org/10.1007/978-3-030-24409-5_17