Importar
En esta parte del libro, aprenderá a importar una gama más amplia de datos en R, así como a convertirlos en una forma útil para el análisis. A veces, esto es solo una cuestión de llamar a una función desde el paquete de importación de datos apropiado. Pero en casos más complejos, puede ser necesario ordenar y transformar para llegar al rectángulo ordenado con el que preferiría trabajar.
En esta parte del libro, aprenderá cómo acceder a los datos almacenados de las siguientes maneras:
En 20 Hojas de calculo, aprenderá a importar datos de hojas de cálculo de Excel y Google Sheets.
En 21 Bases de datos, aprenderá a sacar datos de una base de datos y llevarlos a R (y también aprenderá un poco acerca de cómo sacar datos de R a una base de datos).
En 22 Arrow, aprenderá sobre Arrow, una poderosa herramienta para trabajar con datos sin memoria, especialmente cuando se almacenan en formato parquet.
En 23 Datos jerárquicos, aprenderá a trabajar con datos jerárquicos, incluidas las listas profundamente anidadas producidas por datos almacenados en formato JSON.
En 24 Web scraping, aprenderá “scraping” web, el arte y la ciencia de extraer datos de páginas web.
Hay dos paquetes importantes de tidyverse que no discutiremos aquí: haven y xml2. Si trabaja con datos de archivos SPSS, Stata y SAS, consulte el paquete haven, https://haven.tidyverse.org. Si está trabajando con datos XML, consulte el paquete xml2, https://xml2.r-lib.org. De lo contrario, deberá investigar un poco para determinar qué paquete necesitará usar; Google es tu amigo aquí 😃.