Kannattaisi ruveta tekemään sellaista ohjelmaa jonka tarkoituksena olisi hakea .pdf tiedostoista tietoja jotka olisi jaoteltu usean eri kriteerin mukaan...
Lisäksi ohjelmassa tulisi olla sellainen jonkin moinen "graaffinen käyttöliittymä" ja sen pitäisi toimia xp:ssä.
.pdf rivejä on useita tuhansia joista sen haun pitäisi tapahtua.
Tietysti nuo .pdf:t voisi varmaankin kirjoitella uusiksikin, mutta olisi nyt edes jotain millä pääsisi alkuun.
Ja koska olen ihan noviisi niin mielellään ihan ymmärrettäviä vinkkejä.
No jos olet ihan noviisi, niin ehkä olisi syytä aloittaa jostain yksinkertaisesta, kuten esim. Visual Basic. Tai jos haluat suoraan vaikeempaa, mutta edistyneempää ja nopeampaa, niin ehkä C++.
Varmaan helpoiten tuollaisen ohjelman saa aikaan Visual Basicilla tai Delphillä. En tunne PDF-tiedostojen rakennetta, mutta jos tekstit on tallennettu sellaisenaan, niiden etsiminen tiedoston sisältä kyllä onnistuu. Jos et ole ohjelmoinut aikaisemmin, joudut kuitenkin käyttämään paljon aikaa opettelemiseen, ennen kuin voit tuollaisen ohjelman tehdä.
PHP:ssä on pdf-tuki, ja User Contributed Notesin ensimmäisestä viestistä löydätkin tuon etsimisfunktion. Mutta ah graafinen käyttöliittymä, noh voihan sen väsätä vaikka Javalla :)
EDIT: Eipä taida olla plaintextiä pdf:ssä. Paitsi ainakin osa dokumentin tiedoista näyttäisi olevan selkokielisiä.
Perl olisi oiva tuohon pdf:n parsimiseen mutta käyttöliittymän teko voi olla aika tuskaa. :)
Javasta löytyy kaikki mitä tällaisessa tehtävässä tarvitaan. Regexpit ovat tarpeen ja pdf:lle löytyy hyviä kirjastoja. GUI:n tekokin onnistuu, joskin sen tekeminen hyvin vaatii hieman enempi taitoa kuin esim VB:llä tahi Delphillä.
Aihe on jo aika vanha, joten et voi enää vastata siihen.