Kirjautuminen

Haku

Tehtävät

Keskustelu: Yleinen keskustelu: Hakukoneet ja ajax-linkit

pistemies [12.06.2010 15:11:51]

#

Ruukaako hakukoneet etsiä myös javascript-koodista linkkejä:

objekti = new XMLHttpRequest();

objekti.open("GET", "tiedosto.php?pla=plap");

Tällaisella selaimella nimittäin kävi tiedostossa tiedosto.php
compatible; Googlebot/2.1; http://www.google.com/bot.html

Arvelen, että tuskin oli hakukone... johtuen noista pla pla tiedoista.

Ps. tekaisi tohon linkin, vaikka ei ollu tarkoitus...

Grez [12.06.2010 15:18:25]

#

No jos mietit onko se googlen vai ei niin katso IP ja tsekkaa onko se googlen vai ei. Kyllä minulle tulee mieleen montakin syytä miksi Google voisi yrittää indeksoida sen. Yksinkertaisimmillaan joku katsonut koodista ladattavan osoitteen ja laittanut sen omalle sivulleen.

pistemies [12.06.2010 15:38:52]

#

Joo, pikkuisen outo sikäli, että siinä on päiväys (get[pv]) 30 ja kuukausi (get[kk]) 4 eli 30.4. ja nyt on 12.6 ;))
Mutta muutin hiukan tuota php-tiedostoa, niin että referer tiedoissa pitää löytyä oma domain.
Ip-osoitteessa kaksi viimeistä numeroa eroaa siitä, mikä on googlebotin edellisen vierailun ip-numero ollut.

Grez [12.06.2010 16:13:44]

#

Pekka Mansikka kirjoitti:

Mutta muutin hiukan tuota php-tiedostoa, niin että referer tiedoissa pitää löytyä oma domain.

Eli rikoit sen niiltä käyttäjiltä, joilla on referer pois päältä selaimesta.

Fiksumpaa olisi pistää sivua luotaessa siihen vaikka timestamp ja sitten vaan hylätä pyyntöpäässä esim. 2 tuntia vanhemmat timestampit.

Pekka Mansikka kirjoitti:

Ip-osoitteessa kaksi viimeistä numeroa eroaa siitä, mikä on googlebotin edellisen vierailun ip-numero ollut.

Eikö olisi helpompaa vaan katsoa onko se vai eikö se ole, kuin vertailla johonkin aikaisempaan käyntiin?

Jos se on oikeasti googlen botti, niin IP:tä vastaava nimi pitäisi olla muotoa crawl-vv-xx-yy-zz.googlebot.com eli esim. crawl-66-249-66-1.googlebot.com on 66.249.66.1.

pistemies [12.06.2010 18:06:09]

#

Kyllä tuo ip on googlen omistuksessa.
Käyttäytyminen sivulla on vaan ikään kuin joku 12-vuotias php-tiedoston testaaja.
Cpanelin mukaan käväissyt tänään n. klo 9.15.
Tiedostoon tallentunut käyntiaika 30.4. klo 17.00. GMT aika 31.5 klo 0.00, jäljessä GMT ajasta -7 tuntia.
Tuo kuukauden ero on ilmeisesti oma moka, hoksasin siinä tällaisen jutun:

var kuukausi = d.getMonth()+1;

Tuohon piti lisätä yksi, jotta näyttää halutun. :)
Mutta päiväys 30.5 klo 17 ja klo 24.00 (31.5 klo 0.00) on myös täysin pielessä.

Vastaus

Aihe on jo aika vanha, joten et voi enää vastata siihen.

Tietoa sivustosta