Kirjautuminen

Haku

Tehtävät

Keskustelu: Yleinen keskustelu: Milläköhän kielellä

regedit [23.06.2004 13:02:33]

#

Kannattaisi ruveta tekemään sellaista ohjelmaa jonka tarkoituksena olisi hakea .pdf tiedostoista tietoja jotka olisi jaoteltu usean eri kriteerin mukaan...

Lisäksi ohjelmassa tulisi olla sellainen jonkin moinen "graaffinen käyttöliittymä" ja sen pitäisi toimia xp:ssä.

.pdf rivejä on useita tuhansia joista sen haun pitäisi tapahtua.

Tietysti nuo .pdf:t voisi varmaankin kirjoitella uusiksikin, mutta olisi nyt edes jotain millä pääsisi alkuun.

Ja koska olen ihan noviisi niin mielellään ihan ymmärrettäviä vinkkejä.

hunajavohveli [23.06.2004 13:23:48]

#

No jos olet ihan noviisi, niin ehkä olisi syytä aloittaa jostain yksinkertaisesta, kuten esim. Visual Basic. Tai jos haluat suoraan vaikeempaa, mutta edistyneempää ja nopeampaa, niin ehkä C++.

Antti Laaksonen [23.06.2004 13:27:08]

#

Varmaan helpoiten tuollaisen ohjelman saa aikaan Visual Basicilla tai Delphillä. En tunne PDF-tiedostojen rakennetta, mutta jos tekstit on tallennettu sellaisenaan, niiden etsiminen tiedoston sisältä kyllä onnistuu. Jos et ole ohjelmoinut aikaisemmin, joudut kuitenkin käyttämään paljon aikaa opettelemiseen, ennen kuin voit tuollaisen ohjelman tehdä.

tsuriga [23.06.2004 13:31:09]

#

PHP:ssä on pdf-tuki, ja User Contributed Notesin ensimmäisestä viestistä löydätkin tuon etsimisfunktion. Mutta ah graafinen käyttöliittymä, noh voihan sen väsätä vaikka Javalla :)

EDIT: Eipä taida olla plaintextiä pdf:ssä. Paitsi ainakin osa dokumentin tiedoista näyttäisi olevan selkokielisiä.

renni [25.06.2004 13:28:51]

#

Perl olisi oiva tuohon pdf:n parsimiseen mutta käyttöliittymän teko voi olla aika tuskaa. :)

Javasta löytyy kaikki mitä tällaisessa tehtävässä tarvitaan. Regexpit ovat tarpeen ja pdf:lle löytyy hyviä kirjastoja. GUI:n tekokin onnistuu, joskin sen tekeminen hyvin vaatii hieman enempi taitoa kuin esim VB:llä tahi Delphillä.

Vastaus

Aihe on jo aika vanha, joten et voi enää vastata siihen.

Tietoa sivustosta