Programa para descargar datos de una web
Puedes utilizar la función `read_html()` de la biblioteca `rvest` para descargar datos de una web en R. A continuación, te muestro un ejemplo de cómo hacerlo: **Instalación de la biblioteca rvest** ```r # Instalar la biblioteca rvest install.packages("rvest") # Cargar la biblioteca rvest library(rvest) ``` **Descargar datos de una web** ```r # URL de la web que deseas descargar url <- "https://www.example.com" # Descargar la página web pagina <- read_html(url) # Verificar si la página se cargó correctamente print(pagina) ``` **Extraer datos de la página web** ```r # Extraer los títulos de la página títulos <- pagina %>% html_nodes("h1") %>% html_text() # Extraer los enlaces de la página enlaces <- pagina %>% html_nodes("a") %>% html_attr("href") # Extraer el texto de la página texto <- pagina %>% html_nodes("p") %>% html_text() # Imprimir los resultados print(títulos) print(enlaces) print(texto) ``` **Guardar los datos en un archivo CSV** ```r # Crear un dataframe con los datos extraídos df <- data.frame(títulos, enlaces, texto) # Guardar el dataframe en un archivo CSV write.csv(df, "datos.csv", row.names = FALSE) ``` Recuerda reemplazar la URL y los nodos de la página web con los que deseas trabajar. **Nota**: Asegúrate de que la página web que deseas descargar no tenga restricciones de robots (robots.txt) que impidan la descarga de datos. **Bibliotecas recomendadas** * `rvest`: para descargar y extraer datos de páginas web. * `xml2`: para trabajar con documentos XML. * `httr`: para realizar solicitudes HTTP y descargar datos de páginas web. **Consejos** * Asegúrate de que la página web que deseas descargar tenga un formato de código HTML claro y fácil de leer. * Utiliza la función `html_nodes()` para seleccionar los nodos de la página web que deseas extraer. * Utiliza la función `html_text()` para extraer el texto de los nodos seleccionados. * Utiliza la función `write.csv()` para guardar los datos extraídos en un archivo CSV.