3/2012

Louhimalla tietoa liikenneonnettomuuksista

Marko Järvenpää

-Olisi mielenkiintoista nähdä, miten esimerkiksi vakuutusyhtiöiden datasta
louhittu tieto täydentäisi onnettomuusdatasta saatuja tuloksia. Löytyisikö
sellaisia syitä ja riippuvuuksia, jotka eivät ole olleet liikennesuunnittelijoiden,
lainsäätäjien ja muiden asiantuntijoiden tiedossa, ja joihin ei sen vuoksi ole
osattu tarttua, Marko Järvenpää pohtii.

TTY:n matematiikan laitoksella louhittiin tietoa Poliisin ja Liikenneviraston rekistereihin kertyneestä tieliikenneonnettomuuksia koskevasta datasta. Samalla todettiin GUHA-menetelmän soveltuvuus tällaisen datan analysoimiseen.

Poliisi rekisteröi vuosina 2004 - 2008 Suomessa yhteensä 83 509 tieliikenneonnettomuutta. Niistä loukkaantumisiin johti useampi kuin joka viides. Kuolemaan johti 1 203 onnettomuutta, ja enemmän kuin yksi ihmishenki 90 tapauksessa. Dosentti Esko Turusen johtama sovelletun logiikan tutkimusryhmä löysi näistä onnettomuuksista kerätystä tietoaineistosta runsain mitoin riippuvuuksia GUHA-tiedonlouhintamenetelmällä.

Onnettomuus soratiellä sattuu naiselle selvänä ja miehelle kännissä

Menetelmällä löytyi vastaus muun muassa kysymykseen "Ovatko jotkin onnettomuustyypit erityisen tyypillisiä naiskuljettajille?" Laskettuaan määriteltyjen muuttujien avulla datasta yli 45 miljoonaa eri vaihtoehtoa tuotti hypoteesiautomaatiksikin kutsuttu GUHA-menetelmä tuloksen: "Datassa on tiedot 166 loukkaantumiseen jäisellä tiellä johtaneesta onnettomuudesta, jotka ovat tapahtuneet aamupäivällä tai päivällä, ja joissa osallisena on ollut 36-55-vuotias kuljettaja. Näissä tapauksissa kuljettajista 102 oli naisia."

Sadat tietokoneet louhivat tietoa

Tiedonlouhinta tarkoittaa tietokoneella suoritettavia menetelmiä, joilla pyritään löytämään merkityksellisiä riippuvuuksia ja ominaisuuksia suurista tietomassoista. Data on tyypillisesti mittauksia teollisuusprosessista, otteita asiakastietokannasta tai systemaattisesti tilastoitua tietoa.

Onnettomuusdatan analysoinnissa hyödynnettiin Techila PC Grid-järjestelmää, jossa laskenta hajautettiin neljällesadalle TTY:n opiskelijakäyttöön tarkoitetulle tietokoneelle. Yhdellä PC:llä laskenta-aikaa olisi kertynyt valituilla menetelmillä yli 300 vuorokautta, mutta TTY:n grid-järjestelmällä päästiin murto-osaan tästä.

GUHA-menetelmällä ja LISp-Miner-ohjelmistolla voitiin louhia tieliikenneonnettomuusdatasta riippuvuuksia, joita muilla tiedonlouhintamenetelmillä ei saada näkyviin. Koska dataa on niin paljon, siitä voidaan löytää jotain mielenkiintoista - jotain mitä ei osaa etukäteen edes etsiä.

- Datan mukaan vuosina 2004 - 2008 naisten osuus kaikista yli 80 000 tieliikenneonnettomuudesta oli noin neljännes, mutta tässä tapauksessa reilusti yli puolet. Siksi voidaan olettaa, että aamupäivällä tai päivällä jäisellä tiellä kokeneemmatkin naiskuljettajat joutuvat miehiä herkemmin onnettomuuteen, sanoo tutkimusapulainen Marko Järvenpää.

Liikenneonnettomuustilastoista louhittu data kertoo myös, että yön tai aamuyön yksittäisonnettomuuksissa osallisena on lähes aina mies. Soratiellä selvin päin ajaville naisille tapahtuu suhteellisesti ottaen kaksi kertaa enemmän onnettomuuksia kuin miehille. Nuoret miehet suistuvat soratieltä kännissä kesäyönä. Tyypillinen kortittoman kuljettajan yksittäisonnettomuus tapahtuu yöllä tai aamuyöllä, lauantaisin, alkoholin vaikutuksen alaisena ja harvaan asutulla alueella. Kuljettaja on tyypillisesti alle 25-vuotias mies.

- Kortittomille mieskuskeille ominaista on suistua mutkassa oikealle. Naisille taas tapahtuu suhteellisesti huomattavasti useammin ohitusonnettomuuksia sekä kapeilla teillä tapahtuneita kohtaamisonnettomuuksia, jossa molemmissa osallisena on raskas ajoneuvo.

Se pieni ero...

Mutta miten on, vastaako data ikuisuuskysymykseen - kumpi on parempi kuski, mies vai nainen? Tähän ei tutkimusryhmä uskalla eikä halua ottaa kantaa.

- Datasta puuttuu tieto siitä, mikä on mies- ja naiskuljettajien osuus kaikessa tieliikenteessä. Siksi datan perusteella ei voida arvioida, onko jompikumpi sukupuoli alttiimpi onnettomuuksille, Järvenpää perustelee.

Hän myös muistuttaa, ettei GUHA-menetelmä testaa hypoteeseja annetusta datasta, vaan tuottaa niitä mahdollisia jatkotutkimuksia varten. Tiedonlouhinnalla saatujen olettamien merkittävyyttä voitaisiin edelleen tutkia esimerkiksi tilastotieteen menetelmin.

Menetelmä toimii

Osa datan tuottamista olettamista ei yllätä. Alkoholin vaikutuksen alaisena ajaminen on suuri turvallisuusriski. Rattijuoppojen onnettomuuksista suuri osa on tieltä ulosajoja. Nokkakolarit kovassa vauhdissa raskaan ajoneuvon kanssa ovat usein kohtalokkaita.

- Se, että saimme tällaisia yleisesti tiedossa olevia tuloksia osoittaa, että testattu menetelmä toimii. Jyväskylän yliopiston tutkimusryhmä sai samanlaisia tuloksia analysoidessaan samaa aineistoa muilla tiedonlouhintamenetelmillä, Järvenpää sanoo.

Varsinaisesti onnettomuuksien syihin ei tiedonlouhinnan kautta päässyt pureutumaan. Onnettomuuksista ei ole raportoitu ajoneuvoihin liittyviä yksityiskohtia tai teknisiä tietoja. Myös tiedot kuljettajan ajotavasta ja -historiasta tai mahdollisista aiemmista liikennerikkomuksista puuttuivat.

- Näiden lisäksi myös tiedot turvavälistä, turvavöiden ja kypärän ja muiden turvallisuusvarusteiden käytöstä olisivat olleet hyödyllisiä onnettomuustyyppien tarkemmassa analysoinnissa ja liikenteen suunnittelussa, toteaa Turunen.

 

TIESITKÖ? Yksittäisonnettomuuksista vakavimmat tapahtuvat tieliikenteessä tyypillisesti yöllä ja aamuyöllä, jolloin suuri turvallisuusriski itselleen ja kyytiläisilleen ovat alle 36-vuotiaat kuljettajat. Kesällä iltapäivällä ja iltaisin tapahtuu yksittäisonnettomuuksia suhteellisesti huomattavasti enemmän kuin vastaavaan aikaan syksyllä.

 

 

Teksti: Marjut Kemiläinen
Kuva: Virpi Andersin

 

Kerro kaverille
Vauhti kiihtyy älyliikenteen kehittämisessä
Vauhti kiihtyy älyliikenteen kehittämisessä
3/2012
Vauhti kiihtyy älyliikenteen kehittämisessä
Liikenteen suunnittelussa punnitaan arvot
Liikenteen suunnittelussa punnitaan arvot
3/2012
Liikenteen suunnittelussa punnitaan arvot
EcoIST lataa älyä moottoripyörään
EcoIST lataa älyä moottoripyörään
3/2012
EcoIST lataa älyä moottoripyörään
Hyytyykö kilowattituntivauhti pakkaseen?
Hyytyykö kilowattituntivauhti pakkaseen?
3/2012
Hyytyykö kilowattituntivauhti pakkaseen?
Mittava rahoitus rautatierakennetutkimukselle
Mittava rahoitus rautatierakennetutkimukselle
3/2012
Mittava rahoitus rautatierakennetutkimukselle
Kustannukset pakottavat kuljetusyrityksiä energiatehokkuuteen
Kustannukset pakottavat kuljetusyrityksiä energiatehokkuuteen
3/2012
Kustannukset pakottavat kuljetusyrityksiä energiatehokkuuteen
Miksi auton tuulilasi jäätyy pahemmin kuin sivuikkunat?
Miksi auton tuulilasi jäätyy pahemmin kuin sivuikkunat?
3/2012
Miksi auton tuulilasi jäätyy pahemmin kuin sivuikkunat?
Pirkanmaan liikenne syynissä
Pirkanmaan liikenne syynissä
3/2012
Pirkanmaan liikenne syynissä
Tee oma maailmasi
Tee oma maailmasi
3/2012
Tee oma maailmasi
Menestyspelin taustalla yleensä vuosien työ
Menestyspelin taustalla yleensä vuosien työ
3/2012
Menestyspelin taustalla yleensä vuosien työ
Varainkeruu tuotti vahvan säätiöpääoman
Varainkeruu tuotti vahvan säätiöpääoman
3/2012
Varainkeruu tuotti vahvan säätiöpääoman
TTY haluaa vahvistaa suhdettaan alumneihinsa
TTY haluaa vahvistaa suhdettaan alumneihinsa
3/2012
TTY haluaa vahvistaa suhdettaan alumneihinsa
 
3/2012

Tampereen teknillinen yliopisto on teknologisen kehityksen tiennäyttäjä sekä tutkimusmaailman ja elinkeinoelämän yhteistyökumppani. Yliopistosta valmistuu haluttuja osaajia yhteiskunnan eri aloille.

Käyntiosoite:
Korkeakoulunkatu 10,
33720 Tampere

Postiosoite:
PL 527, 33101 Tampere

Puhelinvaihde:
03 311 511
ma–pe kello 8–16.15
kesällä ma–pe 8–15.45

Virallinen sähköpostiosoite:
tty.asiointi@tut.fi