Sobre el análisis de la forma de los datos: un nuevo paradigma en ciencia de datos

Autores/as

  • Jesús Francisco Espinoza-Fierro Universidad de Sonora
  • Yitzhak David Gutiérrez-Moya Universidad de Sonora
  • Rosalía Guadalupe Hernández-Amador Universidad de Sonora

DOI:

https://doi.org/10.29105/cienciauanl22.96-4

Palabras clave:

análisis topológico de datos, complejo de Vietoris-Rips, complejo de Cech, bola minimal

Resumen

La ciencia de datos es un área multidisciplinaria en la que convergen herramientas de estadística, cómputo científico, matemáticas puras y un profundo entendimiento del contexto del problema a estudiar. Dentro de esta área han surgido recientes investigaciones en las que el análisis se enfoca en un aspecto más cualitativo del estudio, a saber: la forma de los datos. En el presente trabajo describimos esquemáticamente algunas de las herramientas para implementar dicho análisis y presentamos como propuesta un algoritmo eficiente, auxiliar en el estudio de estructuras de baja dimensión simplicial, inmersas en un espacio de representabilidad de dimensión alta.

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Jesús Francisco Espinoza-Fierro, Universidad de Sonora

Licenciado en Matemáticas por la UniSon. Doctor en Ciencias Matemáticas, con especialidad en Topología Algebraica, por la UNAM. Profesor-investigador e integrante del núcleo básico del Programa de Posgrado  de Matemáticas de la UniSon. Cuenta con perfil Prodep. Sus líneas de interés son la geometría  computacional, teorías de homología y series de tiempo simpliciales, así como sus aplicaciones en ciencia  de datos en el área de la salud, medio ambiente y mercados de criptoactivos. Miembro del SNI, nivel candidato.

Yitzhak David Gutiérrez-Moya, Universidad de Sonora

Licenciado en Matemáticas por la UniSon. Estudiante de la Licenciatura en Ciencias de la Computación de  la UniSon. Colaborador en el grupo de trabajo en Análisis Topológico de Datos-UniSon a través del Proyecto  Prodep Métodos de topología combinatoria en el análisis de datos, para actividades de investigación en  geometría computacional.

Rosalía Guadalupe Hernández-Amador, Universidad de Sonora

Licenciada en Matemáticas por la UniSon. Maestra en Ciencias Matemáticas por la UNAM. Doctora en  Ciencias Matemáticas por la UniSon. Sus líneas de investigación son la geometría (diferencial y discreta) y  sus aplicaciones en ciencia de datos.

Citas

Carlsson, G., Zomorodian, A., Collins, A., et al. (2004). Persistence barcodes for shapes. Proceedings of the 2004 Euro-graphics/ACM SIGGRAPH symposium on Geometry processing-SGP’04. pp. 124-135. DOI: 10.1145/1057432.1057449 DOI: https://doi.org/10.1145/1057432.1057449

Fischer, K., Gärtner, B. y Kutz, M. (2003). Fast Smallest-Enclosing-Ball Computation in High Dimensions. Algorithms-ESA 2003. pp. 630-641. DOI: 10.1007/978-3-540-39658-1_57 DOI: https://doi.org/10.1007/978-3-540-39658-1_57

Gärtner, B. (1999). Fast and Robust Smallest Enclosing Balls. AlgorithmsESA’99. pp. 325-338. DOI: 10.1007/3- 540-48481-7_29 DOI: https://doi.org/10.1007/3-540-48481-7_29

Ghrist, R. (2007). Barcodes: The persistent topology of data. Bulletin of the American Mathematical Society. 45(1):61-75. DOI: 10.1090/s0273-0979-07-01191-3 DOI: https://doi.org/10.1090/S0273-0979-07-01191-3

Gutiérrez-Moya, Y. (2018). Complejo simplicial de Čech debaja dimensión: Un algoritmo ad hoc para su construcción. Universidad de Sonora, Tesis de Licenciatura. URL http://lic.mat.uson.mx

Le, N., Vergne, A., Martins, P., et al. (2017). Optimizewireless networks for energy saving by distributedcomputation of Čech complex. 2017 IEEE 13th International Conference on Wireless and Mobile Computing, Networking and Communications (WiMob). DOI: 10.1109/WiMOB.2017.8115760 DOI: https://doi.org/10.1109/WiMOB.2017.8115760

Nicolau, M., Levine, A. y Carlsson, G. (2011). Topology based data analysis identifies a subgroup of breast cancers with a unique mutational profile and excellent survival. Proceedings of the National Academy of Sciences. 108(17):7265-7270. DOI: 10.1073/pnas.1102826108 DOI: https://doi.org/10.1073/pnas.1102826108

Otter, N., Porter, M.A., Tillmann, U., et al. (2017). A roadmap for the computation of persistent homology. EPJ Data Science. 6(17). DOI: 10.1140/epjds/s13688-017-0109-5 DOI: https://doi.org/10.1140/epjds/s13688-017-0109-5

Piangerelli, M., Rucco, M., Tesei, L., et al. (2018). Topological classifier for detecting the emergence of epileptic seizures. BMC Res Notes. 11:392. DOI:10.1186/s13104-018-3482-7 DOI: https://doi.org/10.1186/s13104-018-3482-7

Pranav, P., Edelsbrunner, H., van de Weygaert, R., et al.(2017). The topology of the cosmic web in terms of persistent Betti numbers. Monthly Notices of the Royal Astronomical Society. 465(4):4281-4310. DOI: 10.1093/mnras/stw2862 DOI: https://doi.org/10.1093/mnras/stw2862

Taylor, D., Klimm, F., Harrington, H., et al. (2015). Topological data analysis of contagion maps for examining spreading processes on networks. Nature Communications. 6(1). DOI: 10.1038/ncomms8723 DOI: https://doi.org/10.1038/ncomms8723

Yuchen, W., Jialiang, L. y Martins, P. (2018). Distributed Coverage Hole Detection Algorithm Based on ČechComplex. Communications and Networking. pp. 165- 175. DOI:10.1007/978-3-319-78139-6_17 DOI: https://doi.org/10.1007/978-3-319-78139-6_17

Zomorodian, A. (2012). Topological Data Analysis. In:A. Zomorodian (ed.), Advances in Applied and Computational Topology. Providence, Rhode Island: American Mathematical Society. pp. 1-39. DOI: 10.1090/psa-pm/070 DOI: https://doi.org/10.1090/psapm/070/587

Descargas

Publicado

2023-10-26

Cómo citar

Espinoza-Fierro, J. F., Gutiérrez-Moya, Y. D., & Hernández-Amador, R. G. (2023). Sobre el análisis de la forma de los datos: un nuevo paradigma en ciencia de datos. Revista CienciaUANL, 22(96), 54–59. https://doi.org/10.29105/cienciauanl22.96-4

Artículos similares

1 2 3 4 5 6 7 > >> 

También puede Iniciar una búsqueda de similitud avanzada para este artículo.