Kirjautuminen

Haku

Tehtävät

Keskustelu: Nettisivujen teko: Osoitteen "terveyden" tietoon hankkiminen

Sivun loppuun

Burton [21.06.2007 23:38:57]

#

Eli olisko php:llä mahis tehdä semmosta tarkistusta, joka kertois, josko linkki tuottaa esim. 404-errorin? Käyttäisin tätä skriptissä suodattamaan kuolleita sivuja linkkilistasta.

tsuriga [22.06.2007 00:04:35]

#

file_get_contents ja eiko tutkimaan.

Opiskelija [22.06.2007 01:20:21]

#

Jos linkitetyt sivustot on kunnolla tehty niin get_headers() avulla tiedon saa paljon helpommin.

peg [22.06.2007 10:45:23]

#

Hyvää ihan automaattista systeemiä on vaikea tehdä, koska sivu voi olla tilapäisesti poissa verkosta tai ylläpitäjä muuttaa .html -> .php muotoon.
Täytyy niitä sitten vilkaista ihan itsekin. Yksi kohtuullinen tapa on
tilata sivulta 0-5 rivit jotka harvoin ovat tyhjiä tai favicon.ico.

Opiskelija [22.06.2007 13:17:32]

#

peg kirjoitti:

Hyvää ihan automaattista systeemiä on vaikea tehdä, koska sivu voi olla tilapäisesti poissa verkosta tai ylläpitäjä muuttaa .html -> .php muotoon.

Kyllä vain kohtalaisen automaattisen voi tehdä. Jos sivustoon ei saada yhteyttä jne... niin se laitetaan karanteeniin ja pidetään sielä niinkauan kunnes toimii tai poistetaan manuaalisesti.

Ei .html -> .php tai mikään vastaava muutos saisi aiheuttaa 404 erroreita. Vaan käyttäjä pitäisi ohjata vastaavalle php sivulle.

Burton [22.06.2007 13:33:57]

#

Jos linkki olisikin osoite kuvaan (.jpg, .gif ... eikä .html, .php ...), niin onnistuisiko tarkistus paremmin?

Jorgga [22.06.2007 14:51:48]

#

Yleensähhän sivulla lukee lähdekoodissa sivun osoite/nimi joten sitä voisi koittaa etsiä? Toinen mahdollisuus on etsiä copyright tekstiä/merkkiä sivulta.

Edit:
Tuohon kuvakysymyksen: Eli kokeilin paljonko merkkejä on 1x1 pikselin gif tiedostossa jossa pikseli on valkoinen, tulos oli 807 merkkiä ja mbnetin 404 errorissa on merkkejä: 207 joten Len(ainakin se on len vb:ssä ei oo sitä php:ssä paljoo kokeiltuu) funktio voisi toimia. Paitsi tietenkin customoiduissa error sivuissa joissa voi olla paljonkin merkkejä mutta 100 x 100 gif kuvassa on (ehkä käytin laskinta) 8070000 merkkiä varmuuttahan ei ole mutta luulisin näin, mutta tämän perusteella ei luulisi olevan mahdotonta silla kovin monet lähdekoodit eivät kata noin montaa merkkiä?

Ja myös nämä kaikki tavat voi yhdistää. Kokeilemalla selviää.
Toivottavasti jotain auttoi :)

Opiskelija [22.06.2007 15:28:36]

#

Burton kirjoitti:

Jos linkki olisikin osoite kuvaan (.jpg, .gif ... eikä .html, .php ...), niin onnistuisiko tarkistus paremmin?

Kyllä, käytät tuota aikasemmin mainittua functiota. Ja katsot mitä Content-Type ja 0(http + status koodi) palauttaa.


Sivun alkuun

Vastaus

Aihe on jo aika vanha, joten et voi enää vastata siihen.

Tietoa sivustosta