Aineistojen siivoaminen ja paketointi

Alt CKAN logo

Siivotut aineistot tallennetaan Avoindata nimiseen repositoryyn GitHub -palvelussa


Alkuperäislähteissä julkaistut aineistot eivät useinkaan ole sellaisenaan helposti yhdisteltävissä ja käytettävissä. Aineistoja siivotaan ja yhdistellään helposti käytettäviksi datapaketeiksi (joukkoistamalla tottakai). Muokkaus pyritään teemään mahdollisimman läpinäkyvästi julkistamalla myös muokkaukseen käytettävä ohjelmakoodi ja rutiinit. Näin mahdolliset virhetilanteet voidaan jäljittää ja korjata.

Siivottujen aineistojen tallentamiseen käytetään GitHub -palvelua, jossa aineistoista säilyy versiohistoria. GitHub mahdollistaa aineistojen lataamisen ilman ohjelmointitaitoa, mutta myös aineistojen joustavan käytön ohjelmointiprojektien yhteydessä.