Mashups

Cómo hacer un mashup

Un mashup o aplicación web híbrida es una web que captura contenidos de otras webs vía HTTP para crear un nuevo contenido combinación de los anteriores.

Básicamente el proceso para hacer un mashup es el siguiente:

  1. Necesitamos uno o varios ‘feed fuente’, datos fuente en formato sindicado RSS, Atom o JSON. Hay tres posibles situaciones:
    1. Web con feed: si la página ya tiene feed sólo necesitamos la URL del feed, por ejemplo la URL de uno de los feed estándar disponibles en iTunes, el Top 10 Songs, es:
      http://ax.phobos.apple.com.edgesuite.net/WebObjects/MZStore.woa/wpa/…
    2. Web sin feed: si la página no tiene feed tendremos que extraer los datos de la propia web mediante web scraping. Para ello tenemos varias opciones: programar nuestro propio web scraper, usar el programa generador de robots de Openkapow (openkapow.com), o bien utilizar alguna herramienta on-line como el web scraper Dapper (dapper.net).
    3. Web con API: si la página tiene API responderá a las peticiones HTTP con un feed que contiene los datos solicitados, de manera que sólo necesitamos la URL del feed. Por ejemplo, la URL de uno de los feed estándar disponibles en YouTube, el Most viewed, es:
      http://gdata.youtube.com/feeds/api/standardfeeds/most_viewed
      Para buscar vídeos la URL es, por ejemplo:
      http://gdata.youtube.com/feeds/api/videos?vq=skater+parkour&max-results=10
  2. Una vez que tenemos los datos fuente, uno o varios ‘feed fuente’, los combinaremos, filtraremos, ordenaremos, etc. para generar la salida ‘master feed’ en algún formato sindicado RSS, Atom o JSON. Para ello usaremos un editor de mashups, como por ejemplo la herramienta on-line Yahoo Pipes (pipes.yahoo.com).

    Recursos

  3. La salida de Yahoo Pipes, el ‘master feed’, son ya los datos que utilizaremos en nuestra aplicación web híbrida (mashup). Por ejemplo, si estamos trabajando con datos geo-referenciados podemos representarlos en Google Maps (maps.google.com).

Gráficamente:

mashup

Fuentes de datos (source feed)

Una parte importante del trabajo de Estréllate y Arde está relacionado con mashups, sitios web que utilizan contenidos obtenidos de terceros a través de una interfaz pública, feeds, web scraping o APIs para crear nuevos contenidos, combinando de forma innovadora datos ya existentes.

Nuestras principales fuentes de datos son feeds y APIs.

  • Feeds
    Un feed (fuente web) es un medio de sindicación o redifusión web mediante el cual parte de la información de una página web (generalmente título, link, resumen y fecha) se pone a disposición de otros sitios web o de un lector especial, denominado agregador. Habitualmente se lleva a cabo licenciando el feed para que pueda usarse libremente, permitiendo que el contenido del feed pueda ser publicado por otros sitios web sin incurrir en los problemas legales del web scraping. Las fuentes web suelen codificarse en XML siendo los dos principales formatos RSS y Atom. La sindicación web es muy efectiva para difundir y compartir información por lo que cada día hay más medios que utilizan este sistema de redistribución.
  • APIs
    Las APIs permiten establecer servicios web, protocolos y estándares que sirven para intercambiar datos entre aplicaciones web, facilitando la interoperabilidad entre diferentes aplicaciones y plataformas.

Artículos en la categoría "Mashups"

  1. Web scraper Dapper
  2. Editor de mashup Yahoo Pipes
  3. API de Google Maps
  4. Ejemplo de mashup con Google Maps y PHP
  5. Ejemplo de mashup con Last.fm y YouTube
  6. API de productos de Amazon