Artikkeli: Tutkimusraportti: Rautatieliikenteen täsmällisyystiedon jalostaminen kehittyneen data-analytiikan keinoin

Tutkimusraportti: Rautatieliikenteen täsmällisyystiedon jalostaminen kehittyneen data-analytiikan keinoin

Epätäsmällisyys heikentää sekä rautatieliikennejärjestelmän suorituskykyä että sen tarjoaman palvelun laatua. Tämä näkyy kustannuksina matkustajille, liikennöitsijöille, radanpitäjälle ja koko yhteiskunnalle. Asian kriittisyydestä huolimatta täsmällisyys on Suomessa laskenut jo useana vuonna, erityisesti kahden viime talven aikana. Ongelmien johdosta rautatietoimijat ovat ryhtyneet tekemään aktiivista työtä täsmällisyyden parantamiseksi. Tässä yhteydessä on havaittu, ettei täsmällisyyteen liittyvä tietopohja ole parhaalla mahdollisella tasolla: päätöksenteon tueksi tarvittaisiin nykyistä syvällisempää ja kattavampaa tietoa täsmällisyyttä heikentävistä ilmiöistä.

Tämän tutkimuksen tavoitteena on ollut selvittää, miten täsmällisyystiedon jalostamista päätöksenteon tueksi voitaisiin parantaa kehittyneen data-analytiikan menetelmin. Kehittyneellä data-analytiikalla tarkoitetaan menetelmiä ja työkaluja, joilla pyritään automatisoidusti löytämään oleellinen tieto suurista tietomassoista. Rautatieliikennejärjestelmä muodostaa monimutkaisen ja vaikeasti hahmotettavan kokonaisuuden, jonka toiminnasta kerätään paljon dataa. Näin ollen kehittynyt data-analytiikka tarjoaa suuren potentiaalin järjestelmän analysointiin. Työn teoreettinen viitekehys tarkastelee analytiikkaa ennen kaikkea päätöksenteon tukemisen näkökulmasta. Konkreettisista menetelmistä pureudutaan assosiaatio- ja sekvenssianalyysiin, klusterointiin, luokitteluun sekä visuaaliseen analytiikkaan.

Tällä hetkellä Suomen rautatieliikenteen toimijoiden täsmällisyysanalyysit ovat hyvällä perustasolla. Ne tarkastelevat järjestelmää melko yleisellä tasolla, tarkastelusyklin ollessa pääsääntäisesti yksi kuukausi. Raportit antavat kuvan järjestelmän yleisestä suoriutumisesta, mutta niiden käyttäminen päätöksenteon tueksi vaatii yleensä lisäselvityksiä. Datan ja sen analysoinnin nykytila ja siihen liittyvät haasteet ja mahdollisuudet selvitettiin osallistumalla aktiivisesti Liikenneviraston ja VR:n täsmällisyystyötä tekeville foorumeille sekä analyysitoimintaan.

Kehittyneen data-analytiikan teoreettisen viitekehyksen ja nykyisessä analysointitoiminnassa tunnistettujen haasteiden pohjalta työssä toteutettiin useita erilaisia esimerkkianalyysejä hyödyntäen kehittyneen data-analytiikan menetelmiä. Analyysien tarkoituksena on osoittaa, mitä mahdollisuuksia menetelmät tarjoavat tiedontuotantoprosessin kehittämiselle ja edelleen päätöksenteolle. Lisäksi esimerkkianalyysit paljastavat, miten tietojärjestelmiä ja analyysiympäristöjä tulisi kehittää, jotta analysoinnista saataisiin paras mahdollinen hyöty. Kehittyneitä data-analytiikka-menetelmiä hyödyntämällä olisi mahdollisuus tuottaa huomattavasti nykyistä parempaa ja syvällisempää tietoa päätöksenteon tueksi. Menetelmillä analysointi on tehokasta ja nopeaa. Näin aikaa jää analyysien tulkinnalle. Menetelmien täysipainoinen hyödyntäminen kuitenkin edellyttää kehittämistä niin datan ja dataympäristön laadun, analyysitoiminnan kuin tuotetun tiedon hyödyntämisenkin osalta. Tähän kehitystyöhön tehty tukimus antaa hyvät lähtökohdat.

Tutkimus on osa Liikenneviraston ja Tampereen teknillisen yliopiston välistä tutkimusyhteistyötä, jonka pääteemana on rautatieliikenteen täsmällisyys. Tutkimuksen tekivät ja tämän raportin kirjoittivat Tampereen teknillisen yliopiston projektipäällikkö Jouni Paavilainen ja tutkija Arttu-Matti Matinlauri. Tutkimuksen ohessa Matinlauri laati diplomityönsä samasta aihepiiristä. Tutkimus tehtiin tiiviissä yhteistyössä Liikenneviraston kanssa hyödyntäen Liikenneviraston asiantuntemusta ja tietovarantoja.


Rautatieliikenteen täsmällisyystiedon jalostaminen kehittyneen data-analytiikan keinoin -raportti (pdf) Liikenneviraston sivuilla
‹ Liikenneviraston tutkimuksia ja selvityksiä 55/2011 · ISBN 978-952-255-073-6 ›

English summary included / Refining data on rail transport punctuality by means of sophisticated data analysis
Med svenskt sammandrag / Förädling av punktlighetsinformation i järnvägstrafiken genom avancerad dataanalys