Olen yrittänyt etsiä netistä tuloksetta keinoa jolla voisin tehdä yhdestä tekstistä monta eri versiota joissa kaikissa on sisältö sama mutta eri sanajärjestys tai/ja eri sanoja. Osaisiko joku antaa jonkun vihjeen miten minun kannattaisi lähestyä tätä ongelmaa. Netistä löytyy paljon juttuja missä tehdään esim harry potterin lukua käyttäen teksti joka kuulostaa rowlingin kirjoittamalta. Näissä on kuitenkin joku miljoona merkkiä kun omassa tarkoituksessani tekstissä on vain 50-100 merkkiä. Voinko siis jotenkin käyttää muiden tekstejä että kone oppisi ymmärtämään että bike and bicycle tarkoittaa samaa asiaa ja sen jälkeen muokata omaa tekstiäni siten että sanoja muutellaan ja myös kone osaisi kieliopin jolloin se voisi vaihdella sanojen paikkoja ja lauseiden.
Synonyymejä voi vaihtaa vaikka bashin sed-komennolla. Huomaa kuitenkin, että vaikka bike ja bicycle ovatkin synonyymejä, niin bicycle kick ja bike kick eivät ole. Eli ohjelman tulisi tunnistaa, mikä osa voidaan korvata synonyymillä. Luulisin, että voisi kannattaa tehdä tiedosto tai tietokanta synonyymeistä.
Aihe on jo aika vanha, joten et voi enää vastata siihen.