Imprimir

Web scraper Dapper

Dapper (dapper.net) es un web scraper, una herramienta on-line que permite extraer datos de una web, lo que se denomina web scraping. Dapper se utiliza para obtener un 'feed fuente', datos fuente en formato sindicado RSS, Atom o JSON, desde una página que no tiene feed, para utilizarlo posteriormente en un mashup.

Veamos un ejemplo de cómo obtener un 'feed fuente' a partir de una web que no dispone de feed, MySpace TV (vids.myspace.com).

  1. Vamos al web scraper Dapper (dapper.net), indicamos la página fuente de datos, MySpace TV (vids.myspace.com), y seleccionamos los campos que queremos mostrar:

    mashup dapper

  2. Obtendremos el 'feed fuente':

    mashup dapper feed

  3. Para terminar, seleccionamos el formato del feed y obtenemos la URL:

    mashup dapper rss

1 comentario en “Web scraper Dapper”

  • Carmen dice:

    Hola,

    cuando llego al paso 3, la respuesta es: una pagina donde dice: “rest client not null”. No se si es problema mio que no estoy haciendo las cosas bien o hay algun problema en dapper.net. El sitio web del que intento extraer los datos es: http://www.mepsyd.es/educacion.html. Alguien me podria contestar cual puede ser mi problema.

    Gracias

Deja un comentario