Kirjautuminen

Haku

Tehtävät

Keskustelu: Nettisivujen teko: Automaattinen tiedonkerääjä

Sivun loppuun

Jaska [02.10.2010 17:18:45]

#

Onko mahdollista tehdä sellainen sovelma, joka kirjautuisi tunnuksillani Facebookiin, etsisi kaikki ne, joilla on syntymäpäivä tänään, kirjoittaisi seinälle onnittelut ja kirjautuisi ulos? Eräs tuttuni väitti, että Facebook blokkaa tuollaiset botit. Haluaisin myös sellaisen botin, joka etsisi puolestani eri työnvälityssivuilta kaikki työpaikat, joissa esiintyy sana matematiikka tai matemaatikko.

-tossu- [02.10.2010 17:53:54]

#

Jaska kirjoitti:

Onko mahdollista tehdä sellainen sovelma, joka kirjautuisi tunnuksillani Facebookiin, etsisi kaikki ne, joilla on syntymäpäivä tänään, kirjoittaisi seinälle onnittelut ja kirjautuisi ulos? Eräs tuttuni väitti, että Facebook blokkaa tuollaiset botit.

Varmasti on, se tuskin on edes kovin vaikeaa. Mikäli sen botin tekee kunnolla, ei Facebook voi mitenkään tietää, onko kyseessä botti vai ihminen.

Jaska kirjoitti:

Haluaisin myös sellaisen botin, joka etsisi puolestani eri työnvälityssivuilta kaikki työpaikat, joissa esiintyy sana matematiikka tai matemaatikko.

Tuokaan ei ole kovin vaikeaa. Jos haluat enemmän apua, niin kerro mille työnvälityssivulle botti pitäisi tehdä.

Jaska [02.10.2010 18:09:26]

#

Olen vielä aika aloittelija näissä asioissa.

-tossu- kirjoitti:

Tuokaan ei ole kovin vaikeaa. Jos haluat enemmän apua, niin kerro mille työnvälityssivulle botti pitäisi tehdä.

Olisi kiva saada sellainen lista, jossa olisi koottu netistä löytyvät avoimet paikat. Mieleen tulee lähinnä sivut http://www.mol.fi/paikat/ , http://www.aarresaari.net/jobboard.htm , http://monster.fi/ ja http://sisaanheitto.fi/?Avoimet_ty%F6paikat .

Jokotai [02.10.2010 19:55:04]

#

mol sanahaku
aarresaari etsi hakusanalla
monster hakusana
sisaanheitto ei suoraan, tee oma etsijä, joka käy kaikki linkit avoimiin työpaikkoihin ja iskee näytölle jos löytyy sana matematiikka, matemaatikko

jos haluat automaation, niin sitten vaan laitat sen hakemaan noilla sanoilla ja keräämään linkkilistaa

Jaska [02.10.2010 21:07:16]

#

Ilmeisesti pitäisi opetella käyttämään Snoopyä, jotta saisin lähetettyä dataa sanahaulle vai kuinka?

Jokotai [02.10.2010 21:18:22]

#

Oikeastaan voit käsitellä HTML:ää ihan muutenkin.

-tossu- [02.10.2010 21:18:27]

#

Jaska kirjoitti:

Ilmeisesti pitäisi opetella käyttämään Snoopyä, jotta saisin lähetettyä dataa sanahaulle vai kuinka?

Mitä ihmeen Snoopyä?

Se miten saat lähetettyä dataa sanahaulle, riippuu käyttämästäsi ohjelmointikielestä.

Jaska [02.10.2010 21:33:01]

#

PHP:tä käytän. Snoopy on käsittääkseni PHP-kirjasto, jolla voi simuloida nettisurffailua.

Metabolix [02.10.2010 21:36:34]

#

Voit toki käyttää jotain hienoa kirjastoakin, mutta jos sivusto ei vaadi kirjautumista tms. hienouksia, on yksinkertaisempaa ladata sivu suoraan funktiolla file_get_contents. Tarvittaessa ylimääräisiä HTTP-otsikoita tai POST-dataa voi lisätä virtakontekstin avulla.

Jaska [02.10.2010 21:58:48]

#

Tuolla funktiolla ajattelin haun toteuttaa, mutta jotta saisin oikean sivun parsittavaksi, minun pitäisi syöttää sivulle http://www.mol.fi/paikat/ hakusanaksi matematiikka ja painaa Etsi-painiketta. Miten nuo kohdat saa automatisoitua?

Macro [02.10.2010 22:00:41]

#

Ei, riittää että Metabolixin mainitsemalla file_get_contents()-funktiolla haet sivun http://www.mol.fi/paikat/Search.do?lang=fi­&searchExecute=true&municipalities=&province=---&search=Etsi&country=---&freshness=1&duration=11&type=21&rentalLabour­=---&searchphrase=matematiikka.

Toinen vaihtoehto on tilata RSS syöte: http://www.mol.fi/paikat/Search.do?lang=fi­&searchExecute=true&municipalities=&province=---&search=Etsi&country=---&freshness=1&duration=11&type=21&rentalLabour­=---&searchphrase=matematiikka.&rss=true&id­=6e51d4700a693333014c12efefd9691a

Jaska [02.10.2010 22:05:09]

#

Totta. Tuo onkin yksinkertaisempaa kuin nappien painamisen simuloiminen. Kiitos avusta! Toisaalta olisi kiva opetella tuo nappien painallustekniikkakin vaikkapa yllä mainitsemalla Facebookin automaattionnittelijalla.

Metabolix [02.10.2010 22:22:53]

#

Palvelimen kannalta automaattinen ja nappia painamalla tehty sivunlataus eivät mitenkään eroa toisistaan, jos vain lähetät samanlaisen pyynnön. Graafisia botteja on typerää tehdä, jos saman voi tehdä helpomminkin. Graafinen botti on monin verroin alttiimpi virheille ja sivuston muutoksille, esimerkiksi muutaman pikselin muutoksille sivuston ulkoasussa.

Jaska [25.10.2010 16:12:37]

#

Nyt sain vähän ristiriitaista tietoa. Sivun http://stackoverflow.com/questions/3998586/python-facebook-login mukaan ainakaan Pythonilla ei ole mahdollista tarkistaa, onko käyttäjä kirjautunut Facebookiin.

Metabolix [25.10.2010 16:27:53]

#

Olet varmaankin käsittänyt jotain väärin – kuten tuonkin keskustelun aloittaja. Tuossahan puhutaan suunnilleen siitä, voiko Pythonilla laittaa oman Firefoxinsa kirjautumaan Facebookiin, eikä suinkaan siitä, voiko itse Pythonilla kirjautua ja suorittaa toimenpiteitä. Kuten tuollakin sanotaan:

Stack Overflow'n käyttäjä Peter Bailey kirjoitti:

As an example, if you log into Facebook on you phone - you can't then pull up Facebook on your desktop machine and be logged in.

Mikään ei estä surffaamasta Facebookissa Pythonilla vaikka joka päivä – se vain on paljon vaikeampaa kuin selaimella surffailu, joten aika harva viitsii. Pythonilla voi tehdä samat asiat (ja usein enemmänkin) kuin selaimella ja saada täsmälleen samat sivut (HTML-koodina) ohjelman muuttujiin.

Matso [27.10.2010 09:53:53]

#

Facebookkiin on varmaan joku API olemassa, kannattaa tutkia jos semmosella onnistuis ensin kuin alkaa perinteisellä tapaa parsimaan sivuja. Kai Facebookille on esim. jotain iPhone sovelluksiakin, jotka varmasti perustuu API pyyntöihin.

Ihan arvuuttelen, en itse FB:tä etes käytä, mutta valmiilla rajapinnalla tosiaan voi olla 10 kertaa helpompaa tehdä asioita kun jollain sivujen parsimisella.

Lebe80 [27.10.2010 10:34:28]

#

Matson kanssa samaa mieltä. API löytyy ja tukee kaikennäköisiä juttuja, joita käytetään mm. uudemmissa peleissä, desktop aplikaatioissa yms. yms. eli käytä sitä.


Sivun alkuun

Vastaus

Aihe on jo aika vanha, joten et voi enää vastata siihen.

Tietoa sivustosta