Terve,
re_cat = re.compile(r"cat(?P<cat>[\d]{1,2})") print re.search(re_cat,div['class'])
Tuo yläpuolella oleva regex tuottaa käsittääkseni osumia?:
<_sre.SRE_Match object at 0xa109ba0>
<_sre.SRE_Match object at 0xa109ba0>
<_sre.SRE_Match object at 0xa109ba0>
<_sre.SRE_Match object at 0xa109ba0>
...
Miten sitten saan tuosta tulostettua tuon categorian numeron? Divit, joiden luokasta haen tuota categorian numeroa ovat mallia:
<div class="cat2">
Jos re.search osuu, se palauttaa match-objektin, kuten tulostuksesta näkyy. Sen käsittely sujuu näin:
re_cat = re.compile(r"cat(?P<cat>[\d]{1,2})") m = re.search(re_cat, div['class']) if m: print m.group('cat')
Tuolla esimerkkejä: http://docs.python.org/library/re.html
Jes kiitoksia Chiman.
Löysin muuten aivan mahtavan ohjelman noihin regular expressionien käsittelyyn. Ohjelman nimi on Regexbuddy. Suosittelen kaikille!
Aihe on jo aika vanha, joten et voi enää vastata siihen.