Kirjautuminen

Haku

Tehtävät

Keskustelu: Projektit: Suomi-Englanti dataset tekoälylle

E.K.Virtanen [09.12.2024 18:10:18]

#

Terve.

Olen aikani kuluksi tällaista vääntänyt: https://github.com/EkBass/fin-eng-translations-set

Tarkoitus siis olisi saada nyt ainakin 100k käännettyä sanaa, lausetta tahi kappaletta aikaiseksi pääosin hyvällä laadulla.

Ideana on, että tätä voi sitten aikanaan käyttää vaikka paikallisen tekoälyn kouluttamiseen. ChatGPT nyt puhuu jo kohtuu hyvää suomea, mutta tämä siis on tarkoitettu nimenomaan paikallisen tekoälyn käyttöön.

Meidän kielen ongelma pääosin on se, että sanat ovat keskimäärin hieman pitempiä kuin englanniksi olevat vastineensa ja tämä voi vaikuttaa siihen, miten sanat "tokenisoidaan". Onkohan tuolle sanalle oikeasti vielä pätevää vastinetta meidän kielelle :-/

Enivei, dataa on jo sen verran että yksin tätä ei enää jaksa ja ehdi viedä eteenpäin.

Tarvisin siis apuja.

Uusia käännöksiä, erilaisista aiheista ja mieluiten vielä murteiden saattelemana.

Ihan vaan datan läpikäyntiä. Jos loisi jonkinlaisen softan joka tuo ruutuun tekstin molemmilla kielillä ja sen voisi helposti sitten arvostella "huono", "neutraali", "hyvä". Tätä kautta sitten käännöskukkasten löytäminen helpottuisi.

Olen siis manuaalisesti käynyt tuota dataa hemmetisti läpi, mutta siinä helposti silmät ja aivot väsyvät ja hölmötkin virheet pääsevät läpi.

Mun puolesta dataa voi tuottaa itse kääntäen tai koneellisesti, kunhan se käydään läpi ja varmistetaan että käännös meni oikein. Googlen translate, ChatGPT jne. tekevät meidän kielen kohdalla monia hölmöyksiä, joten hemmetin ison suomenkielistä tekstiä sisältävän tiedoston tuuppaaminen translaten läpi ei riitä.

Jos siis kiinnostaa edes hieman jeesailla, niin ota toki yhteyttä täällä tai tuolla githubin puolella.

Ja siis tämä on harrastusta. Ei tarvitse olla velho ja taikuri äidinkielessä, järkevät ja toimivat käännökset ovat se millä pärjätään.

Ja tämä siis ei ole mitenkään sensuroitu tai muutoin rajoitettu projekti. Minun puolesta sinne saa kääntää vaikka eroottisen kirjan jos siihen haluaa ryhtyä. Äidinkieltä se sekin on.

wy5vn [09.12.2024 22:14:39]

#

En auta missään mikä liittyy tekoälyn kehittämiseen.

vesikuusi [15.12.2024 01:40:18]

#

wy5vn kirjoitti:

En auta missään mikä liittyy tekoälyn kehittämiseen.

Minulla on sinulle ikäviä uutisia....

https://chatgpt.com/share/675e1712-f254-800a-965e-0badba895fb9

E.K.Virtanen [20.12.2024 08:29:04]

#

Moi.

Tekoäly ei ole muuta kuin yksi työkalu muiden joukossa. Vaikka se toki tuntuu joillain tahoilla saaneen jo uskonnollisen agendan aseman, niin kyseessä ei ole muuta kuin työkalu.

Tämä on täysin vapaaehtoinen ja vapaa-ajalla tehtävä projekti, jos ei kiinnosta niin sitten ei kiinnosta. Muilta osin tekoälystä vänkäämään alkaminen tässä yhteydessä ei hyödytä tasan ketään ;)

Vastaus

Muista lukea kirjoitusohjeet.
Tietoa sivustosta