Downloaden van alle foto’s van mijnalbum.nl

Zie http://keeshink.blogspot.nl/2008/09/fotos-downloaden-van-mijnalbumnl.html voor het oorspronkelijke artikel

 

Installeren: python-lxml

Daarna dit script draaien met als argument het album-id (kijk in http://www.mijnalbum.nl/Album=[AlbumID]U&Foto=[FotoID])

#!/usr/bin/python

import sys
from lxml import etree
from lxml import objectify
from urllib import urlopen

# pass the album id as a command line argument
album_id = sys.argv[1]
thumbs_url = 'http://www.mijnalbum.nl/index.php?m=albumview&a=2&key='
thumbs_url += album_id

parser = etree.HTMLParser()
page = urlopen(thumbs_url)
html = page.read()

htmltree  = etree.HTML(html)

for element in htmltree.xpath("body/table/tr/td[@class='thumbfoto']"):
    id = element.get('id')
    to_be_stripped = 'thumbcont-'
    foto_id = id.replace(to_be_stripped,'',1)
    foto_url = 'http://www.mijnalbum.nl/GroteFoto-'+foto_id+'.jpg'
    print foto_url

Daarna de uitvoer omleiden met xargs wget