Tahtoisin säännöllisen lausekkeen mikä poistaa html:n paitsi sen sisällä olevat rivin vaihdot. Olen saanut tehtyä koodin mikä poistaa kaiken paitsi rivivaihdot ja toisen koodin mikä poistaa html:n, mutta en onnistu millään yhdistämään niitä.
Poistaa html
test = "rivi1<\n\nrivi3\n\n>rivi5" print re.sub(r'<[^>]*?>', '', test)
Tulostaa
rivi1rivi5
Poistaa rivivälit
test = "rivi1<\n\nrivi3\n\n>rivi5" print re.sub(r'[^\n]', '', test)
Tulostaa
(5 tyhjää riviä jotka ei jostakin syystä näy tässä)
Koodi jonka tahtoisin
test = "rivi1<\n\nrivi3\n\n>rivi5" print re.sub(r'jotakin hienoa', '', test)
Tulostaa
rivi1 rivi5
test = "rivi1<\n\nrivi3\n\n>rivi5" print re.sub(r'<([^>]*?)>', lambda m: re.sub(r'[^\n]', '', m.group(0)), test)
funktio kirjoitti:
test = "rivi1<\n\nrivi3\n\n>rivi5" print re.sub(r'<([^>]*?)>', lambda m: re.sub(r'[^\n]', '', m.group(0)), test)
Kiitti :)
Aihe on jo aika vanha, joten et voi enää vastata siihen.