Sobre el análisis de la forma de los datos: un nuevo paradigma en ciencia de datos
DOI:
https://doi.org/10.29105/cienciauanl22.96-4Keywords:
análisis topológico de datos, complejo de Vietoris-Rips, complejo de Cech, bola minimalAbstract
La ciencia de datos es un área multidisciplinaria en la que convergen herramientas de estadística, cómputo científico, matemáticas puras y un profundo entendimiento del contexto del problema a estudiar. Dentro de esta área han surgido recientes investigaciones en las que el análisis se enfoca en un aspecto más cualitativo del estudio, a saber: la forma de los datos. En el presente trabajo describimos esquemáticamente algunas de las herramientas para implementar dicho análisis y presentamos como propuesta un algoritmo eficiente, auxiliar en el estudio de estructuras de baja dimensión simplicial, inmersas en un espacio de representabilidad de dimensión alta.
Downloads
References
Carlsson, G., Zomorodian, A., Collins, A., et al. (2004). Persistence barcodes for shapes. Proceedings of the 2004 Euro-graphics/ACM SIGGRAPH symposium on Geometry processing-SGP’04. pp. 124-135. DOI: 10.1145/1057432.1057449 DOI: https://doi.org/10.1145/1057432.1057449
Fischer, K., Gärtner, B. y Kutz, M. (2003). Fast Smallest-Enclosing-Ball Computation in High Dimensions. Algorithms-ESA 2003. pp. 630-641. DOI: 10.1007/978-3-540-39658-1_57 DOI: https://doi.org/10.1007/978-3-540-39658-1_57
Gärtner, B. (1999). Fast and Robust Smallest Enclosing Balls. AlgorithmsESA’99. pp. 325-338. DOI: 10.1007/3- 540-48481-7_29 DOI: https://doi.org/10.1007/3-540-48481-7_29
Ghrist, R. (2007). Barcodes: The persistent topology of data. Bulletin of the American Mathematical Society. 45(1):61-75. DOI: 10.1090/s0273-0979-07-01191-3 DOI: https://doi.org/10.1090/S0273-0979-07-01191-3
Gutiérrez-Moya, Y. (2018). Complejo simplicial de Čech debaja dimensión: Un algoritmo ad hoc para su construcción. Universidad de Sonora, Tesis de Licenciatura. URL http://lic.mat.uson.mx
Le, N., Vergne, A., Martins, P., et al. (2017). Optimizewireless networks for energy saving by distributedcomputation of Čech complex. 2017 IEEE 13th International Conference on Wireless and Mobile Computing, Networking and Communications (WiMob). DOI: 10.1109/WiMOB.2017.8115760 DOI: https://doi.org/10.1109/WiMOB.2017.8115760
Nicolau, M., Levine, A. y Carlsson, G. (2011). Topology based data analysis identifies a subgroup of breast cancers with a unique mutational profile and excellent survival. Proceedings of the National Academy of Sciences. 108(17):7265-7270. DOI: 10.1073/pnas.1102826108 DOI: https://doi.org/10.1073/pnas.1102826108
Otter, N., Porter, M.A., Tillmann, U., et al. (2017). A roadmap for the computation of persistent homology. EPJ Data Science. 6(17). DOI: 10.1140/epjds/s13688-017-0109-5 DOI: https://doi.org/10.1140/epjds/s13688-017-0109-5
Piangerelli, M., Rucco, M., Tesei, L., et al. (2018). Topological classifier for detecting the emergence of epileptic seizures. BMC Res Notes. 11:392. DOI:10.1186/s13104-018-3482-7 DOI: https://doi.org/10.1186/s13104-018-3482-7
Pranav, P., Edelsbrunner, H., van de Weygaert, R., et al.(2017). The topology of the cosmic web in terms of persistent Betti numbers. Monthly Notices of the Royal Astronomical Society. 465(4):4281-4310. DOI: 10.1093/mnras/stw2862 DOI: https://doi.org/10.1093/mnras/stw2862
Taylor, D., Klimm, F., Harrington, H., et al. (2015). Topological data analysis of contagion maps for examining spreading processes on networks. Nature Communications. 6(1). DOI: 10.1038/ncomms8723 DOI: https://doi.org/10.1038/ncomms8723
Yuchen, W., Jialiang, L. y Martins, P. (2018). Distributed Coverage Hole Detection Algorithm Based on ČechComplex. Communications and Networking. pp. 165- 175. DOI:10.1007/978-3-319-78139-6_17 DOI: https://doi.org/10.1007/978-3-319-78139-6_17
Zomorodian, A. (2012). Topological Data Analysis. In:A. Zomorodian (ed.), Advances in Applied and Computational Topology. Providence, Rhode Island: American Mathematical Society. pp. 1-39. DOI: 10.1090/psa-pm/070 DOI: https://doi.org/10.1090/psapm/070/587