{"id":882,"date":"2014-02-05T03:14:31","date_gmt":"2014-02-05T09:14:31","guid":{"rendered":"http:\/\/rodrigosotomoreno.com\/revistanew\/?p=882"},"modified":"2017-11-14T12:31:04","modified_gmt":"2017-11-14T18:31:04","slug":"tema-35-investigacion-reproducible-con-r-commander","status":"publish","type":"post","link":"https:\/\/cienciauanl.uanl.mx\/?p=882","title":{"rendered":"Tema 35: Investigacio\u0301n reproducible con R Commander"},"content":{"rendered":"<p style=\"text-align: right;\">PETER B. MANDEVILLE*<\/p>\n<p style=\"text-align: right;\"><a href=\"http:\/\/eprints.uanl.mx\/3601\/1\/Revista_Ciencia_Enero_-_Febrero_2014.pdf\" target=\"_blank\">CIENCIA UANL \/ A\u00d1O 17, No. 65, ENERO-FEBRERO 2014<\/a><\/p>\n<p style=\"text-align: center;\">You need to prepare your students<\/p>\n<p style=\"text-align: center;\">for the future, not the past.<\/p>\n<p style=\"text-align: center;\">Spencer Graves<sup>1<\/sup><\/p>\n<p style=\"text-align: center;\">La reproducibilidad ha sido una parte clave de la investigacio\u0301n cienti\u0301fica y se ha<\/p>\n<p style=\"text-align: center;\">denominado la \u00abdemarcacio\u0301n entre ciencia y nociencia\u00bb.<\/p>\n<p style=\"text-align: center;\">Christopher Gandrud<sup>2\u00a0<\/sup><\/p>\n<p>\u00a0<a href=\"http:\/\/cienciauanl.uanl.mx\/wp-content\/uploads\/2014\/02\/rcommanderlogo.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone  wp-image-886\" src=\"http:\/\/cienciauanl.uanl.mx\/wp-content\/uploads\/2014\/02\/rcommanderlogo.jpg\" alt=\"rcommanderlogo\" width=\"626\" height=\"475\" srcset=\"https:\/\/cienciauanl.uanl.mx\/wp-content\/uploads\/2014\/02\/rcommanderlogo.jpg 1450w, https:\/\/cienciauanl.uanl.mx\/wp-content\/uploads\/2014\/02\/rcommanderlogo-300x227.jpg 300w, https:\/\/cienciauanl.uanl.mx\/wp-content\/uploads\/2014\/02\/rcommanderlogo-1024x776.jpg 1024w\" sizes=\"auto, (max-width: 626px) 100vw, 626px\" \/><\/a><\/p>\n<p>Los resultados de una investigacio\u0301n son reproducibles si hay suficiente informacio\u0301n disponible para que investigadores independientes consigan los mismos resultados con los mismos procedimientos. (2) La investigacio\u0301n reproducible requiere que los conjuntos de datos y el co\u0301digo computacional este\u0301n disponibles para la verificacio\u0301n de los resultados publicados y la realizacio\u0301n de ana\u0301lisis alternativos. (2-4)<\/p>\n<div>\n<div>\n<p>La necesidad de la publicacio\u0301n de investigaciones reproducibles aumenta por varias razones: (3,4)<\/p>\n<ol>\n<li>Los investigadores examinan con mayor frecuencia la debilidad de las asociaciones e interacciones complejas.<\/li>\n<li>Las nuevas tecnologi\u0301as permiten a los cienti\u0301ficos compilar bases de datos complejos de alta dimensio\u0301n.<\/li>\n<li>El desarrollo de mayores capacidades estadi\u0301sticas y computacionales permite a los investigadores explorar las bases de datos e identificar asociaciones de intere\u0301s, y aumenta la probabilidad de identificar asociaciones espurias.<\/li>\n<li>Los informes de investigacio\u0301n fraudulenta publicados en la bibliografi\u0301a biome\u0301dica.<\/li>\n<li>A medida que los ana\u0301lisis se hacen ma\u0301s complicados, aumenta la posibilidad de errores, producto de resultados engan\u0303osos.<\/li>\n<li>Los desconocedores del uso de software tambie\u0301n pueden conducir a problemas, especialmente cuando e\u0301ste se aplica a situaciones no imaginadas originalmente.<\/li>\n<\/ol>\n<\/div>\n<div>\n<p>Mientras que muchos estari\u0301an de acuerdo con la investigacio\u0301n reproducible, hay una falta general de infraestructura para apoyar estos esfuerzos. (3,4)<\/p>\n<p>Los coeditores de la revista Biostatistics apoyan la pra\u0301ctica de la investigacio\u0301n reproducible; y en 2009, Roger D. Peng fue nombrado editor asociado para la reproducibilidad. (5)<\/p>\n<p>Con respecto a R, (6) la aplicacio\u0301n ma\u0301s utilizada para la reproducibilidad es RStudio, (7,8) que se utiliza para producir informes en los formatos html, latex y pdf , con el paquete knitr. (9)<\/p>\n<p>Kuhn (10) revisa el apoyo para la reproducibilidad en\u00a0R. Xie (9) dice que con R y el paquete knitr se pueden generar trabajos como tareas, informes de investigacio\u0301n y libros.<\/p>\n<div>\n<div>\n<p>Wikipedia sen\u0303ala que entre los GUI\u2019s, interfaz gra\u0301fica de usuario, existentes para R, R Commander (Rcmdr) es la alternativa ma\u0301s parecida a los paquetes estadi\u0301sticos comerciales como SPSS. El paquete es u\u0301til para novatos, ya que para cada ana\u0301lisis se muestra el co\u0301digo. Adema\u0301s, una serie de libros de estadi\u0301stica que utiliza Rcmdr esta\u0301 disponible. (11) Un ejemplo notable es Field, Miles y Field. (12) El autor utiliza la combinacio\u0301n de R y Rcmdr en todos sus cursos de estadi\u0301stica. Un tutorial de Rcmdr esta\u0301 disponible. (13)<\/p>\n<p>A partir de la versio\u0301n 2.00 (19 agosto 2013), se integro\u0301 la generacio\u0301n de reportes HTML y PDF, con los paquetes knitr () y markdown() en Rcmdr. (14)<\/p>\n<p>En Rcmdr, Ayuda -&gt; Usando R Markdown, es un enlace a RStudio. (15) Markdown quick reference en RStudio es otro fuente de informacio\u0301n. (16) Para ma\u0301s detalles consulta Gandrud, (2) Xie. (9)<\/p>\n<p>Desde R, se instala Rcmdr con Packages -&gt; Install package(s)&#8230; -&gt; Rcmdr -&gt; OK. Se puede iniciar Rcmdr, al introducir el siguiente co\u0301digo en R Console, seguido de Enter: library(Rcmdr), o a trave\u0301s de: Packages -&gt; Load package -&gt; Rcmdr -&gt; OK<\/p>\n<p>Se debe utilizar la reproducibilidad con el co\u0301digo final de un proyecto. Se supone que el co\u0301digo siguiente es de un ana\u0301lisis final del conjunto de datos birthwt del paquete MASS, (7) y se quiere generar el reporte final.<\/p>\n<p>Se declara el directorio de trabajo con Fichero -&gt; Cambiar directorio de trabajo&#8230;<\/p>\n<p>Se carga el paquete MASS con Herramientas -&gt; Cargar paquete(s)&#8230; -&gt; MASS -&gt; Aceptar<\/p>\n<p>Se introducen los datos birthwt con Datos -&gt; Con- junto de datos en paquetes -&gt; Leer conjunto de da- tos desde paquete adjunto&#8230; -&gt; MASS -&gt; birthwt -&gt; Aceptar<\/p>\n<p>Se enlistan los datos al introducir el co\u0301digo siguiente en la ventana R Script de Rcmdr, seguido de Ejecutar: birthwt<\/p>\n<p>Se declaran las variables catego\u0301ricas nume\u0301ricas como factores con Datos -&gt; Modificar variables del conjunto de datos activo -&gt; Convertir variable nume\u0301rica en factor. Seleccionar con control click: ht, low, race, smoke, ui. Entonces: Utilizar nu\u0301meros -&gt; Aceptar seguido por: Si -&gt; Si -&gt; Si -&gt; Si -&gt; Si.<\/p>\n<\/div>\n<div>\n<p>Se efectu\u0301a la estadi\u0301stica descriptiva con Estadi\u0301sti- cos -&gt; Resu\u0301menes -&gt; Conjunto de datos activo.<\/p>\n<p>Se levanta un histograma de bwt con Gra\u0301ficas -&gt; Histograma&#8230; -&gt; bwt -&gt; Aceptar<\/p>\n<p>Se levanta un diagrama de caja de bwt con Gra\u0301fi- cas -&gt; Diagrama de caja&#8230; -&gt; bwt -&gt; Aceptar<\/p>\n<p>Se levanta un qqplot de bwt con Gra\u0301ficas -&gt; Gra\u0301- fica de comparacio\u0301n de cuantiles&#8230; -&gt; bwt -&gt; Aceptar Se efectu\u0301a un modelo lineal de bwt, con respecto a age, smoke y ht, con Estadi\u0301sticos -&gt; Ajuste de modelos -&gt; Modelo lineal&#8230; -&gt; bwt -&gt; age -&gt; smoke -&gt;\u00a0ht -&gt; Aceptar<\/p>\n<p>Se efectu\u0301a un anova simulta\u0301neo con: Modelos -&gt;<\/p>\n<p>Test de hipo\u0301tesis -&gt; Tabla ANOVA&#8230; -&gt; Aceptar<\/p>\n<p>Se calculan los li\u0301mites de confianza de los coeficientes de regresio\u0301n con Modelos -&gt; Intervalos de confianza&#8230; -&gt; Aceptar<\/p>\n<p>Se levantan las gra\u0301ficas ba\u0301sicas de diagno\u0301stico con\u00a0Modelos -&gt; Gra\u0301ficas -&gt; Gra\u0301ficas ba\u0301sicas de diagno\u0301stico<\/p>\n<p>Se efectu\u0301a una prueba de hipo\u0301tesis de normalidad de los residuos, con el procedimiento Shapiro-Wilk, al introducir el co\u0301digo siguiente en la ventana R Script de Rcmdr, seguida de Ejectuar: shapiro.test(LinearModel.1$resid)<\/p>\n<p>Se cita R, al introducir el co\u0301digo siguiente en la ventana R Script de Rcmdr, seguido de Ejecutar: citation()<\/p>\n<p>Se cita el paquete Rcmdr, al introducir el co\u0301digo siguiente en la ventana R Script de Rcmdr, seguido de Ejecutar: citation(package=\u201dRcmdr\u201d)<\/p>\n<p>Se cita el paquete MASS, al introducir el co\u0301digo siguiente en la ventana R Script de Rcmdr, seguido de Ejecutar: citation(package=\u201dMASS\u201d)<\/p>\n<p>Se cita el paquete car, al introducir el co\u0301digo si- guiente en la ventana R Script de Rcmdr, seguido de Ejecutar: citation(package=\u201dcar\u201d)<\/p>\n<p>Se cita el paquete knitr, al introducir el co\u0301digo si- guiente en la ventana R Script de Rcmdr, seguido de Ejecutar: citation(package=\u201dknitr\u201d)<\/p>\n<p>Entonces se selecciona R Markdown, y se mueve el cursor al principio de la ventana.<\/p>\n<p>Se reemplaza <em>Replace with Main Title<\/em> con el nombre del ana\u0301lisis: birthwt<\/p>\n<p>Se reemplaza <em>Your Name<\/em> con un nombre: Fulano de tal<\/p>\n<p>Se introduce el co\u0301digo siguiente que define el\u00a0hardware, sistema operativo, versio\u0301n de R y los paquetes utilizados en el ana\u0301lisis:<\/p>\n<p>### sistema<br \/>\n\u2018\u2018\u2018{r} print(sessionInfo())<\/p>\n<p>\u2018\u2018\u2018<\/p>\n<div>\n<div>\n<p>Los chunks de co\u0301digo parecen entre \u2018\u2018\u2018{r} y \u2018\u2018\u2018. Se puede introducir el texto entre los chunks de co\u0301digo (para ver ejemplos consulte RStudio.com15,16).<\/p>\n<p>Cuando se termina, se genera el reporte al selec- cionar: Generar informe HTML, y despue\u0301s de una pausa aparece el reporte.<\/p>\n<p>Cuando se termina su sesio\u0301n en Rcmdr, acepta Save Workspace Image?<\/p>\n<p>En el directorio de trabajo se encuentra un subdirectorio llamado figure, con las gra\u0301ficas genera- das y los archivos: .RData (RDATA File), (RHistory File), RcmdrMarkdown (HTML Document), RcmdrMarkdown (MD File), RcmdrMarkdown (RMD File). El archivo RcmdrMarkdown.Rmd es texto y contiene el co\u0301digo. El archivo RcmdrMarkdown.md es texto y contiene ambos co\u0301- digo y salida. Se recomienda que se cambien los nom- bres de los tres archivos RcmdrMarkdown a birthwt.<\/p>\n<p>La generacio\u0301n del archivo HTML debe estar con la versio\u0301n final del co\u0301digo, pero se pueden realizar cam- bios en el documento birthwt.Rmd y, entonces, se puede generar de nuevo el archivo birthwt.HTML con R.<\/p>\n<p>Por ejemplo, se puede incorporar la salida de la funcio\u0301n citation() en el archivo birthwt.md, en lugar de incluir las llamadas a la funcio\u0301n por reemplazar las li\u0301neas en birthwt.Rmd:<\/p>\n<p>\u2018\u2018\u2018{r} citation() \u2018\u2018\u2018<\/p>\n<p>\u2018\u2018\u2018{r} citation(package=\u00bbRcmdr\u00bb) \u2018\u2018\u2018<\/p>\n<p>\u2018\u2018\u2018{r} citation(package=\u00bbMASS\u00bb) \u2018\u2018\u2018<\/p>\n<\/div>\n<div>\n<p>\u2018\u2018\u2018{r} citation(package=\u00bbcar\u00bb) \u2018\u2018\u2018<\/p>\n<p>\u2018\u2018\u2018{r} citation(package=\u00bbknitr\u00bb) \u2018\u2018\u2018<\/p>\n<p>con:<\/p>\n<p>**Referencias**<\/p>\n<p>Fox, J. (2005). The R Commander: A Basic Statistics Graphical User Interface to R. Journal of Statistical Software, 14(9):1-42.<\/p>\n<p>John Fox and Sanford Weisberg (2011). An {R} Companion to Applied Regression, Second Edition. Thousand Oaks CA: Sage. URL:<\/p>\n<p>http:\/\/socserv.socsci.mcmaster.ca\/jfox\/Books\/ Companion<\/p>\n<p>R Core Team (2013). R: A language and environment for statistical computing. R Founda- tion for Statistical Computing, Vienna, Austria. URL: http:\/\/www.R-project.org\/<\/p>\n<p>Venables, W. N. &amp; Ripley, B. D. (2002) Modern Applied Statistics with S. Fourth Edition. Springer, New York. ISBN 0-387-95457-0<\/p>\n<p>Yihui Xie (2013). knitr: A general-purpose package for dynamic report generation in R. R package version 1.5.<\/p>\n<p>Yihui Xie (2013) Dynamic Documents with R and knitr. Chapman and Hall\/CRC. ISBN 78- 1482203530<\/p>\n<p>del archivo birthwt.md.<\/p>\n<p>Se cambia el directorio de trabajo al directorio con los archivos generados en R con File -&gt; Change dir&#8230; Entonces se introduce el co\u0301digo siguiente en R Console, seguido de Enter: 2<\/p>\n<p>library(knitr) knit2html(\u201cbirthwt.Rmd\u201d)<\/p>\n<p>El resultado es un documento que describe el hardware utilizado, la versio\u0301n de R instalada, las versiones de los paquetes utilizados, lista los datos, lista los coman-<\/p>\n<div>\n<div>\n<p>dos, lista la salida, incluyendo las gra\u0301ficas; lista la refe- rencia de R y lista las referencias de los paquetes utili- zados.<\/p>\n<p>Se puede extraer el co\u0301digo fuente en R al introdu- cir el co\u0301digo siguiente en R Console, seguido de Enter:2<\/p>\n<p>library(knitr) purl(\u201cbirthwt.Rmd\u201d)<\/p>\n<p>Se puede convertir el reporte a otros formatos con Pandoc,18 que es gratuito.<\/p>\n<p>Debe hacerse notar que para generar un archivo PDF se requiere que TeX este\u0301 instalado y tener cono- cimiento de su uso. El autor ha encontrado que es mucho ma\u0301s fa\u0301cil convertir archivos HTML a archivos PDF con doPDF Free PDF Converter.19<\/p>\n<p>Referencias<\/p>\n<p>1.\u00a0Spencer Graves (making a case for using R in acade- mia) R-help (November 2006).<\/p>\n<p>2.\u00a0Christopher Gandrud. Reproducible Reserch with R and RStudio. The R Series. Chapman &amp; Hall\/CRC, Boca Raton, FL, USA. 2014.<\/p>\n<p>3. \u00a0Roger D. Peng. Reproducible Research and Biostatistics. Biostatistics (2009), 10, 3, pp. 405\u2013408.<\/p>\n<p>4.\u00a0Roger D. Peng. Reproducible Research in Computational Science. Science (2011), 334, pp\u00a01226-1227.<\/p>\n<p>5. \u00a0Peter J. Diggle and Scott L. Zeger. Editorial.\u00a0Biostatistics (2009), 10, 3, pp. 405.<\/p>\n<p>6.\u00a0R Core Team (2013). R: A language and environment\u00a0for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL: http:\/\/www.R- project.org\/.<\/p>\n<p>7. \u00a0John Verzani. Getting Started with RStudio: A Integrated Development Environment for R. O\u2019Reilly Media, Inc., Sebastopol, CA, USA. 2011.<\/p>\n<p>8. \u00a0M<span style=\"line-height: 1.5em;\">ark P.J. van del Loo and Edwin de Jonge. Learning RStudio for R Statistical Computing: Learn to effectively perform R development, statistical analysis, and reporting with the most popular R IDE. Packt Publishing Ltd. Birmingham, UK. 2012.<\/span><\/p>\n<p>9. \u00a0Y<span style=\"line-height: 1.5em;\">ihui Xie. Dynamic Documents with R and knitr. The R Series Chapman &amp; Hall\/CRC, Boca Raton, FL, USA. 2014.<\/span><\/p>\n<p>10.\u00a0M<span style=\"line-height: 1.5em;\">ax Kuhn. CRAN Task View: Reproducible Resear- ch. Version: 2013-04-18. URL: http:\/\/cran.r- project.org\/web\/views\/ReproducibleResearch.html. <\/span><\/p>\n<p><span style=\"line-height: 1.5em;\">11. R Commander. (2013, November 4). In Wikipedia, The Free Encyclopedia. Downloaded November 27, 2013, URL: http:\/\/en.wikipedia.org\/wiki\/ R_Commander.<\/span><\/p>\n<p>12. \u00a0A<span style=\"line-height: 1.5em;\">ndy Field, Jeremy Miles, and Zoe Field. Discovering Statistics Using R. Sage Publications Ltd., London, UK. <\/span><\/p>\n<p><span style=\"line-height: 1.5em;\">13. John Fox and Milan Bouchet-Valat. Getting Started With the R Commander. Version 2.0-0 (last modified: 29 July 2013). URL: http:\/\/socserv.mcmaster.ca\/jfox\/ Courses\/soc6z3\/Getting-Started-with-the-Rcmdr.pdf. <\/span><\/p>\n<p><span style=\"line-height: 1.5em;\">14. John Fox and Milan Bouchet-Valet.[R]Rcmdrversion 2.0-0 now on CRAN. Thu, 22 Aug 2013 15:55:29 &#8211; 0700. URL: www.mail-archive.com\/r-help@r- project.org\/msg203634.html. <\/span><\/p>\n<p><span style=\"line-height: 1.5em;\">15. RStudioIDE:UsingRMarkdownwithRStudio.URL: http:\/\/www.rstudio.com\/ide\/docs\/authoring\/ using_markdown.<\/span><\/p>\n<\/div>\n<div>\n<p>16. Studio version 0.97.551, 2009-2012. RStudio, Inc. URL: http:\/\/www.rstudio.com\/.<\/p>\n<p>17.\u00a0W.N. Venables and B. D. Ripley. 2002, Modern Applied Statistics with S. Fourth Edition. Springer, New York. ISBN 0-387-95457-0<\/p>\n<p>18. pandoc. URL: http:\/\/johnmacfarlane.net\/pandoc.<\/p>\n<p>19. doPDF Free PDF Converter. URL: http:\/\/ www.dopdf.com\/.<\/p>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>PETER B. MANDEVILLE* CIENCIA UANL \/ A\u00d1O 17, No. 65, ENERO-FEBRERO 2014 You need to prepare your students for the future, not the past. Spencer Graves1 La reproducibilidad ha sido una parte clave de la investigacio\u0301n cienti\u0301fica y se ha denominado la \u00abdemarcacio\u0301n entre ciencia y nociencia\u00bb. Christopher Gandrud2\u00a0 \u00a0 Los resultados de una investigacio\u0301n son reproducibles si hay suficiente [&#8230;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"categories":[19],"tags":[],"class_list":["post-882","post","type-post","status-publish","format-standard","hentry","category-tips-bioestadisticos"],"_links":{"self":[{"href":"https:\/\/cienciauanl.uanl.mx\/index.php?rest_route=\/wp\/v2\/posts\/882","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/cienciauanl.uanl.mx\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/cienciauanl.uanl.mx\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/cienciauanl.uanl.mx\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/cienciauanl.uanl.mx\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=882"}],"version-history":[{"count":8,"href":"https:\/\/cienciauanl.uanl.mx\/index.php?rest_route=\/wp\/v2\/posts\/882\/revisions"}],"predecessor-version":[{"id":3459,"href":"https:\/\/cienciauanl.uanl.mx\/index.php?rest_route=\/wp\/v2\/posts\/882\/revisions\/3459"}],"wp:attachment":[{"href":"https:\/\/cienciauanl.uanl.mx\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=882"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/cienciauanl.uanl.mx\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=882"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/cienciauanl.uanl.mx\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=882"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}