Web scraper Dapper
Dapper (dapper.net) es un web scraper, una herramienta on-line que permite extraer datos de una web, lo que se denomina web scraping. Dapper se utiliza para obtener un 'feed fuente', datos fuente en formato sindicado RSS, Atom o JSON, desde una página que no tiene feed, para utilizarlo posteriormente en un mashup.
Veamos un ejemplo de cómo obtener un 'feed fuente' a partir de una web que no dispone de feed, MySpace TV (vids.myspace.com).
- Vamos al web scraper Dapper (dapper.net), indicamos la página fuente de datos, MySpace TV (vids.myspace.com), y seleccionamos los campos que queremos mostrar:
- Obtendremos el 'feed fuente':
- Para terminar, seleccionamos el formato del feed y obtenemos la URL:
1 comentario en “Web scraper Dapper”
Deja un comentario
Hola,
cuando llego al paso 3, la respuesta es: una pagina donde dice: “rest client not null”. No se si es problema mio que no estoy haciendo las cosas bien o hay algun problema en dapper.net. El sitio web del que intento extraer los datos es: http://www.mepsyd.es/educacion.html. Alguien me podria contestar cual puede ser mi problema.
Gracias