Olen tutkiskellut vähän esimerkkejä, mitkä tulostavat jonkun osan sivustosta
pelkkänä tekstinä. Kuinka tämä parser toimii käytännössä? Voiko tällä
tulostaa vaikkapa ohjelmointiputka.net etusivulta joitain kohtia niin että
muu osa sivustosta ei näy. Esim. vaikkapa tuon "Keskustelu" laatikon sivun
oikealta puolelta? Valaiskaahan vähäsen, kiitti. : )
Tietyn sivuston HTML-koodin voi hakea merkkijonomuuttujaan vaikkapa funktiolla file_get_contents. Tämän jälkeen pitää enää erottaa merkkijonosta ne osat, jotka haluaa näyttää. Tähän soveltuu vaikkapa funktio substr. Ainoa vaikeus on tietää, mistä kohdasta erotettava osuus alkaa ja mihin kohtaan se päättyy. Yksi keino on etsiä erotettavan kohdan läheltä jokin muuttumaton teksti (esim. otsikko "Keskustelu" ja sitä ympäröivät HTML-tagit) ja selvittää skriptissä tämän kohdan sijainti esim. funktiolla strpos. Joskus voi myös olla niin, että erotettava osa on tiedostossa aina tietyllä rivillä, mikä helpottaa skriptin toteutusta. Näiden skriptien heikkoutena on usein, että jos alkuperäiselle sivulle tehdään pienikin muutos, skripti ei enää toimi.
Teet CSS:llä tulostukselle oman tyylitiedoston, jossa piilotat halutut elementit ja muotoilet muutenkin haluttuun tapaan.
Eikös säännöllisillä lausekkeilla saa jotenkin muuttujaan haettua kaiken vaikkapa väliltä <jotain></jotain> ?
Aihe on jo aika vanha, joten et voi enää vastata siihen.