Eli olisko php:llä mahis tehdä semmosta tarkistusta, joka kertois, josko linkki tuottaa esim. 404-errorin? Käyttäisin tätä skriptissä suodattamaan kuolleita sivuja linkkilistasta.
file_get_contents ja eiko tutkimaan.
Jos linkitetyt sivustot on kunnolla tehty niin get_headers() avulla tiedon saa paljon helpommin.
Hyvää ihan automaattista systeemiä on vaikea tehdä, koska sivu voi olla tilapäisesti poissa verkosta tai ylläpitäjä muuttaa .html -> .php muotoon.
Täytyy niitä sitten vilkaista ihan itsekin. Yksi kohtuullinen tapa on
tilata sivulta 0-5 rivit jotka harvoin ovat tyhjiä tai favicon.ico.
peg kirjoitti:
Hyvää ihan automaattista systeemiä on vaikea tehdä, koska sivu voi olla tilapäisesti poissa verkosta tai ylläpitäjä muuttaa .html -> .php muotoon.
Kyllä vain kohtalaisen automaattisen voi tehdä. Jos sivustoon ei saada yhteyttä jne... niin se laitetaan karanteeniin ja pidetään sielä niinkauan kunnes toimii tai poistetaan manuaalisesti.
Ei .html -> .php tai mikään vastaava muutos saisi aiheuttaa 404 erroreita. Vaan käyttäjä pitäisi ohjata vastaavalle php sivulle.
Jos linkki olisikin osoite kuvaan (.jpg, .gif ... eikä .html, .php ...), niin onnistuisiko tarkistus paremmin?
Yleensähhän sivulla lukee lähdekoodissa sivun osoite/nimi joten sitä voisi koittaa etsiä? Toinen mahdollisuus on etsiä copyright tekstiä/merkkiä sivulta.
Edit:
Tuohon kuvakysymyksen: Eli kokeilin paljonko merkkejä on 1x1 pikselin gif tiedostossa jossa pikseli on valkoinen, tulos oli 807 merkkiä ja mbnetin 404 errorissa on merkkejä: 207 joten Len(ainakin se on len vb:ssä ei oo sitä php:ssä paljoo kokeiltuu) funktio voisi toimia. Paitsi tietenkin customoiduissa error sivuissa joissa voi olla paljonkin merkkejä mutta 100 x 100 gif kuvassa on (ehkä käytin laskinta) 8070000 merkkiä varmuuttahan ei ole mutta luulisin näin, mutta tämän perusteella ei luulisi olevan mahdotonta silla kovin monet lähdekoodit eivät kata noin montaa merkkiä?
Ja myös nämä kaikki tavat voi yhdistää. Kokeilemalla selviää.
Toivottavasti jotain auttoi :)
Burton kirjoitti:
Jos linkki olisikin osoite kuvaan (.jpg, .gif ... eikä .html, .php ...), niin onnistuisiko tarkistus paremmin?
Kyllä, käytät tuota aikasemmin mainittua functiota. Ja katsot mitä Content-Type ja 0(http + status koodi) palauttaa.
Aihe on jo aika vanha, joten et voi enää vastata siihen.