Tietokone näkee ja tulkitsee kuvaa pian kuin ihminen - Tampereen teknillinen yliopisto

Tietokone näkee ja tulkitsee kuvaa pian kuin ihminen


Jiri Matas kävi Tampereella tammikuussa, jolloin FiDiPro-projekti käynnistettiin. Siinä tavoitteena ovat huipputiede, julkaisutoiminnan kehittäminen ja yritysmaailmassa välittömästi sovellettavat tutkimustulokset.

Tietokonenäköön ja koneoppimiseen perehtynyt professori Jiri Matas aloitti nelivuotisen FidiPro-professuurinsa TTY:n signaalinkäsittelyn laitoksella tammikuussa. Projektissa kehitetään mobiiliteknologiaa, joka mahdollistaa suurten kuvadatamassojen entistä paremman ja uudenlaisen hyödyntämisen.

Jiri Matas tulee tunnetusta Center for Machine Perception -laboratoriosta Tšekin teknillisestä yliopistosta Prahasta. Tampereella hän työskentelee professori Joni Kämäräisen johtamassa tietokonenäön ryhmässä.

– Viimeaikaisia tutkimuskohteitani ovat kuvahaku, vapaan tekstin tunnistus, träkkäys ja viimeisenä vaan ei vähäisimpänä syvät neuroverkot. Pitkään olen ollut kiinnostunut myös reaaliaikaisesta hahmontunnistuksesta, sanoo Matas.

Kuvahakuun Matas tutkijoineen on etsinyt uudenlaisia hakukriteereitä. Nykyisillä menetelmillä haku tuottaa tulokseksi lukuisia lähes identtisiä kuvia samasta kohteesta.

– Erilaisia ja paljon informatiivisempia kuvia saa, jos kone tunnistaa myös erilaisissa olosuhteissa ja eri etäisyyksiltä samasta kohteesta otetut kuvat.

Vapaata tekstiä tunnistava kone pystyy lukemaan kaupunkinäkymästä esimerkiksi mainoskyltit ja autojen rekisteritunnukset. Träkkäystä eli kohteen liikkeen seuraamista kamerasta toiseen voidaan hyödyntää esimerkiksi seurannassa ja myös osana autonomisten autojen järjestelmiä. Syvien neuroverkkojen tutkimuksessa saavutettiin hiljattain läpimurto, kun kone oppi tunnistamaan ja nimeämään kuvasta kohteita.

Hyvää tiedettä seuraavat sovellukset

Tekesin rahoittamassa projektissa on mukana suomalaisia yrityksiä esimerkiksi televiestinnän, ohjelmistokehityksen ja elektroniikkakehityksen aloilta. Tutkimuskohteet on sovittu yhdessä yrityskumppanien kanssa, ja niissä lähtökohtina ovat käytännön ongelmat.

Sovellusten sijaan Matas kuitenkin korostaa hyvän tieteen tekemistä.

– Se ei kuulosta kovin konkreettiselta, mutta tämän alan tutkimus tuottaa joka tapauksessa tuloksia, jotka ovat suoraan sovellettavissa.

Hänen tähänastinen tutkimuksensa ja yhteistyönsä yritysten kanssa onkin tuottanut laajan kirjon sovelluksia. Niinpä kuvahaun avulla voi jäljittää verkossa myytävää varastettua tavaraa. Kasvontunnistus ja -analyysi ovat kiinnostavia mainostajien kannalta. Ennen pitkää vapaan tekstin tunnistus mahdollistaa kirjaimista ja kielestä riippumattomat sovellukset. Niistä on hyötyä esimerkiksi länsimaisille matkailijoille maissa, joissa käytetään jotain muuta kuin latinalaista kirjaimistoa.

Uusia ohjausmenetelmiä, parempia julkaisuja

Matas tunnetaan merkittävistä ja näkyvistä tuloksista sekä tutkijana että ohjaajana. Tampereella hän ohjaa kahta jatko-opiskelijaa ja mentoroi ryhmän vanhempia tutkijoita.

– Meitä kiinnostaa, mitä voisimme oppia hänen ohjausmetodeistaan. Lisäksi kehitämme hänen esimerkkinsä innostamina julkaisutoimintaamme. Sen sijaan, että Suomessa korostetaan laadun sijasta määrää, meillä pitäisi olla malttia tehdä huippututkimusta, sanoo Kämäräinen.

Pocket-Sized Big Visual Data -projekti on yhteinen Oulun yliopiston Konenäön tutkimuskeskuksen kanssa.

 

Päivittäjä: Merja Jaaksi, 14.04.2016 11:35.
Sisällöstä vastaa: Laukkanen Tuuli
Asiasanat: tiede ja tutkimus, konenäkö