Minulla on eräs tekstimuodossa oleva aineisto, jossa on runsaasti havaintoja (noin puoli miljoonaa) ja näissä havainnoissa paikkatieto on esitetty kuntanumeron avulla. Idana olisi korvata aineistossa kunnan numero nykyisellä kunnan nimellä. Minulla on Wikipediasta haettu lista Suomen kuntanumeroista ja Kuntaliiton sivuilta haettu lista kuntaliitoksista. Mikä olisi kätevin tapa käydä nuo liitokset läpi ja korvata kunnan kuntanumero sen nykyisellä nimellä?
Teet taulukon, jossa on vanha numero ja nykyinen numero. (Jos nykyinen on edelleen käytössä niin vanha=nykyinen)
Eli tyyliin:
258 258
259 734
260 260
261 261
262 50
263 263
264 264
265 265
266 684
Sitten vaan yhdistät taulut. Esim. SQL:ssä
SELECT M.Uusi, D.* FROM Muutokset M JOIN Data D ON M.Vanha=M.Kunta
Tai jos haluat tosiaan muuttaa aineistosta niin Update kehiin.
Toki vastaavan voi tehdä myös Javalla vaikka tekstitiedostoon, mutta periaate on sama.
Kiitos ideasta. Tuossa tavassa on vain se ongelma, että Suomessa on tapahtunut noin 100 kuntaliitosta tuona aikana, jota aineistoni koskee. On vain aika iso homma tehdä tuollainen luettelo.
Tuosta kopioit ja sit lisäät 2016 muutokset.
http://tilastokeskus.fi/meta/luokitukset/
Kiitos. Hyvä, että tuollainenkin löytyi valmiina.
Aihe on jo aika vanha, joten et voi enää vastata siihen.