Miten datamössö saadaan kuntalaisten palvelukseen?

 

Jos kunnissa halutaan tehdä hyviä päätöksiä, päättäjillä pitää olla käytössään hyvää dataa. Valitettavasti kaikki maailman data on lähtökohtaisesti epämääräistä mössöä. Siitä ei saa mitään hyödyllistä irti ilman massiivista työmäärää.  Turku ei ole poikkeus — ei hyvässä eikä huonossa.  Ongelmiin ei ole helppoja ratkaisuja, mutta jotakin suuntaviivoja voin esittää.

Olen päässyt näkemään Turun datatilannetta sekä luottamushenkilönä että pari vuotta pätkätyöntekijänä (tarkemmin täällä). Tieto lisää tuskaa: luottamushenkilönä kuvittelen kovastikin ymmärtäväni, miten älykästä kaupunkia pitäisi johtaa. Todellisuutta nähneenä  joudun pitämään luottamushenkilöintoani aika naiivina.  Asioiden tekeminen on oikeasti vaikeaa.

Kuntapäättäjänä olisi kovin mukavaa, jos elämä olisi kuin amerikkalainen elokuva: päättäjät sulkeutuvat pimennettyyn tilannehuoneeseen, jossa suurille ruuduille heijastetaan värikkäinä karttoina reaaliaikainen tilanne siitä mitä juuri nyt tapahtuu, ja tekoäly kertoisi mitä juuri nyt pitäisi tehdä.

Todellisuudessa, jos kuntapolitiikka olisi elokuva, se olisi lähinnä jokin ankea 80-luvun kotimainen leffa. Datasta on puutetta, ja se vähäkin on köyhää ja väritöntä. Toisaalta, silloin kun datasta ei ole puutetta, sitä pursuaa niin paljon ja niin epämääräisessä muodossa, että kukaan ei sitä voi hallita.

Sekä päättäjien että kansalaisten olisi hyvä ymmärtää ainakin kolme asiaa.

    1. Hyvän analyysin tai visualisoinnin tekeminen on erittäin työlästä ja kallista.
    2. Julkisella sektorilla erityisesti julkisuuslain ja tietosuojalain yhteentörmäys tuottaa yllättävän suuria haasteita datan käytössä.
    3. Turun kaupungin resurssointi- ja työntekijäpolitiikka ei  tue sitä, että tilanne tästä paranisi.

 

Hyvän visualisoinnin vaatima työmäärä haasteena

Datan avaaminen julkiseksi on tärkeä askel, mutta vasta ensimmäinen askel. Datan jalostaminen päätöksentekoon sopivaksi on hidasta ja kallista.

Konkreettisenä esimerkkinä voi käyttää Turku-tieto-sivua, jolle kaupunki kerää erilaista dataa. Siellä pienaluetilastot ovat hyvä osoitus sekä datan potentiaalista että sen rajoista.  Esimerkiksi väestönlisäysdatasta löytyy myös tieto äidinkielestä, ja näiden yhdistäminen osoittaa aika huolestuttavan trendin: Turussa on alueita, jotka ova segregoitumassa pahasti. Alla Varissuon datat.

Kuva 1: Varissuon segregoitumisongelma datana (lähde).

Datasta nähdään, että kymmenen vuoden aikana Varissuolta on muuttanut pois satoja suomenkielisiä, ja tilalle tullut yli tuhat muunkielistä. Ikäpyramidin perusteella uudet asukkaat ovat enimmäkseen alle 25-vuotiaita.  Oli maahanmuutosta mitä mieltä tahansa, niin selvää on, että tällainen kehitys on riski.

Tällä visualisoinnilla tekee jo paljon, jos osaa sitä tulkita.  Napsuttelemalla muita alueita huomataan, että vastaavaa segregaatiota tapahtuu myös muilla alueilla (erityisesti Lauste, Runosmäki, Perno).

Päättäjänä olisi kätevää, jos datasta saisi aikaan yhden ainoan kartan, joka kertoo värikoodina alueiden segregaatiotason. Tässä kohtaa iskee kuitenkin todellisuus vastaan.  Teknisessä mielessä yllä oleva graafi on lähes edistyneintä, mitä on kohtuullisella työmäärällä mahdollista tehdä.   Kyseessä on käytännössä Tilastokeskuksen datojen visualisointi.  Jos halutaan edistyneempää analyysiä, työmäärä voi kasvaa räjähdysmäisesti.

Jonkun pitää määritellä, mitä tarkoittaa “segregaatiotaso”. Jonkun pitää kerätä tiedot. Jonkun pitää varmistaa että datan laatu on varmasti riittävä eikä siinä ole kummallisuuksia. Jonkun täytyy piirtää graafi. Sen jälkeen täytyy palata alkuperäisen kysyjän luokse ja varmistaa, oliko tämä suunnilleen se mitä pyydettiin ja tarvitaanko sitä ylipäätään oikeasti — ja näitä kierroksia tarvitaan useita. Mutta ennen kaikkea tätä, jonkun pitää päättää kuka analyysin teon maksaa (tai vaihtoehtoisesti, mitä muita analyysejä jätetään tekemättä). Helpon näköinen pyyntö voi aiheuttaa käsittämättömän määrän työtä.

Tähän ongelmaan on käytännössä kaksi mahdollista ratkaisua. Päättäjät voivat joko a) hyväksyä, että kovin hyvää dataa ei ole saatavilla tai b) panostaa lisää rahaa siihen, että jatkossa saadaan parempaa dataa.

Koronavuotena on hiukan uhkarohkeaa tarjota ratkaisuksi kulujen kasvattamista, mutta kaiken uhallakin sitä ehdottaisin. Parempi tietopohja päätöksille maksaa itsensä ennen pitkää takaisin.

 

Julkisuuslaki haasteena

Julkisuuslaki on yksikäsitteisesti hyvä asia, mutta se aiheuttaa myös haasteita ja hitautta jota monet eivät hahmota. Yritysten on hyvin helppo toimia datan kanssa: kaikki on salaista, jos niin halutaan (ja yleensä halutaan).

Kaikki kunnan tuottama tieto sen sijaan on julkista, ellei se jonkin lain tai muun kirjatun syyn perusteella erikseen ole salaista. Tämä luo yllättävänkin työlään väliaskeleen. Osa tiedosta on täysin ongelmatonta, ja voidaan julkaista sellaisenaan. Osa tiedosta esimerkiksi sosiaali- ja terveydenhoitopuolella on yksikäsitteisesti salaista, eikä sitä julkaista missään. Mutta merkittävä osa tiedosta on hankalasti sillä välillä.

Turku-tieto-sivulla asiaan viitataan hyvinkin konkreettisesti.  “Turun kaupungin avoimen datan palvelu on sopimus- ja tietosuojasyistä rajannut aineistojen laajuutta. Aineisto ei sisällä tietoa alueista, joissa on vähemmän kuin 100 asukasta (väestöä koskevat tiedot) tai 10 rakennusta (kiinteistöjä koskevat tiedot). Täten alla olevissa raporteissa esitetyt luvut eivät ole täysin tarkkoja, eivätkä välttämättä esim. vastaa koko Turun asukaslukua.”

Tietosuojalaki edellyttää, että yksittäistä henkilöä ei voi tunnistaa mistään julkaistusta datasta. Jos esimerkiksi jollakin asuinalueella asuu vain yksi satavuotias, ikäpyramiditietoa ei voi sellaisenaan antaa, koska se yksilöi tämän henkilön. Käytännössä ongelma on ratkaistu sillä, että jos jossakin kategoriassa on vaikkapa alle viisi henkilöä, raportoidaan että luokassa on alle viisi henkilöä, mutta määrää ei kerrota.

Jokainen tapaus on omanlaisensa, mutta tiedot on aina käytävä huolellisesti läpi ennen julkaisua — ja tietoja on myös muistettava valvoa jos ne päivittyvät. Tämä ei vaadi rakettitieteen tasoista osaamista, mutta huolellisuutta ja aikaa kyllä.  Lisäksi,  jos prosessi ei ole selkeä, se voi aiheuttaa yksittäiselle työntekijälle melkoisen ristipaineen. Jos ei julkaise dataa, saattaa rikkoa julkisuuslakia. Jos julkaisee dataa, saattaa rikkoa tietosuojalakia.

Tähän ongelmaan ei ole yksinkertaista ratkaisua. Sitä voitaisiin kuitenkin merkittävästi helpottaa sillä, että datan luokitteluun on  systemaattinen ja yksikäsitteinen prosessi. Jos säännöt löytyvät jostakin, työntekijän ei tarvitse päivittäin pohtia, onko hän mahdollisesti rikkomassa jotakin lakia.

Luottamushenkilöiden tulee valvoa että tällainen prosessi todella on olemassa ja käytössä.

 

Kaupungin työntekijäpolitiikka haasteena

Datan käyttö julkisella sektorilla voi siis olla jopa haastavampaa kuin yksityisellä.  Onko julkisella puolella sitten etuja joita ei ole yksityisellä? Eipä juuri. Vuoden 2019 arviointikertomus toteaa, että  “kaupungin palkkataso ei houkuttele osaajia eivätkä vakituinen ja turvattu työpaikka, mahdollisuus liukuvaan työaikaan ja palkattomat vapaat lisää houkuttelevuutta tarpeeksi.”

Datapuolella tuo arvio on jopa ylioptimistinen. Hyvin suuri osa kaupungin kehittämisestä tapahtuu hankkeissa, joihin liittyvät työpätkät voivat olla mitä tahansa muutamasta kuukaudesta pariin vuoteen. Kehityspuolella ei siis ole edes vakituista ja turvattua työpaikkaa täkynä, ja vaihtuvuus onkin suurta.

Vakituiseen pestiin päässeet pyörivät viroissaan vuosikymmeniä, alempi taso taas repii elantonsa pienestä hankesilpusta — tämä ei ole varsinaisesti malli, joka olisi hedelmällisin asioiden muuttamisen ja parantamisen kannalta. Toisaalta hankkeet ylipäätään hyvin harvoin johtavat varsinaisesti  mihinkään muutoksiin, koska ne ovat niin irrallaan kaupungin muusta toiminnasta.

Tähän(kään) ongelmaan ei ole helppoa ratkaisua. Hankkeet ovat suosittuja, koska rahoittaja on usein joku muu, ja  ne ovat usein lähes ilmaisia kaupungille. Jos vastaavia hankkeita koitettaisiin tehdä omin voimin, juuri mikään budjetti ei riittäisi. Hankepyöritykselle ei siis välttämättä ole vaihtoehtoa.

Työntekijöiden pyöritykselle sen sijaan saattaisi olla ratkaisu, tosin monella tapaa epäsuosittu. Silppupaikkoja olisi helpompi vakinaistaa, jos vakinaisista toimista ja jopa viroista olisi vastaavasti helpompi karsia ihmisiä yt-neuvotteluiden kautta, kuten yksityisellä puolella. Nythän tätä vaihtoehtoa ei käytännössä käytetä (mutta työntekijöistä hankkiudutaan eroon massaulkoistusten kautta, eli käytännössä ulkoistetaan yt-neuvottelut uudelle toimijalle).

Tämä tuskin on edes ideaalimaailmassa mahdollinen ratkaisu. Oikealta laidalta vastustetaan tiukasti kaikkia vakinaistamisia, vasemmalta laidalta vastustetaan yhtä tiukasti kaikkia heikennyksiä toimessa olevien työturvaan.  Tätä kuitenkin esittäisin ratkaisuksi, koska muutakaan ei oikein löydy.

Olen Turun Vihreiden ehdokas kuntavaaleissa 2021. Lisätietoja saat täältä

Published by

Jakke Mäkelä

Physicist, but not ideologically -- it's the methods that matter. Background: PhD in physics, four years in basic research, over a decade in industrial R&D. Interests: anything that can be twisted into numbers; hazards and warnings; invisible risks. Worries: Almost everything, but especially freedom of speech, Internet neutrality, humanitarian problems, IPR, environmental issues. Happiness: family, dry humor, and thinking about things.

Translate »