/ Published in: Python
Expand |
Embed | Plain Text
Copy this code and paste it in your HTML
#!/usr/local/bin/python # -*- coding: UTF-8 -*- import sys reload(sys) sys.setdefaultencoding("utf-8") # dette funker jo..! from BeautifulSoup import BeautifulSoup import urllib, re, time url = 'http://www.vg.no/nyheter/innenriks/norsk-politikk/folkevalgte/' html = urllib.urlopen(url).read() suppe = BeautifulSoup(html) table = suppe.findAll('a', href=re.compile('.*?kid=.*')) for i in table: time.sleep(0.5) # don't panic! kommune_id = i['href'].split("=") kommune_id = kommune_id[1] if len(kommune_id) == 3: kommune_id = "0" + kommune_id kommune = i.text print '<li><a href="http://www.vg.no/nyheter/innenriks/norsk-politikk/folkevalgte/api/?kid=%s&format=xml">%s xml</a>, <a href="http://www.vg.no/nyheter/innenriks/norsk-politikk/folkevalgte/api/?kid=%s&format=json">json</a></li>' % (kommune_id, kommune, kommune_id)
URL: http://stavelin.com/uib/data/