Väitöstiedotteet - Tampereen teknillinen yliopisto

Ihmiskuulon inspiroima äänenkäsittely auttaa kehittämään kuulolaitteita

Tom Barker kehitti väitöstutkimuksessaan äänten erottelutekniikan, joka perustuu ihmiskorvan omaan tapaan erotella äänilähteitä. Paremman erottelun avulla voidaan kehittää kuulolaiteita, jotka toimivat paremmin myös arkisissa, hälyisissä ympäristöissä.

Tarkastelemalla ihmisen tapaa havainnoida ääniä voidaan kehittää tehokkaampia tapoja parantaa konekuuntelua (engl. machine listening) eli kehittää laskennallisia menetelmiä äänien tulkitsemiseksi. Yksi osa tulkintaa on eri äänilähteiden erottaminen toisistaan. Tom Barker TTY:n signaalinkäsittelyn laboratoriosta tutki väitöskirjaansa varten useita erilaisia äänilähteiden erottelutekniikoita.

Barker keskittyi muun muassa lähestymistapaan, joka perustuu ihmiskorvan sisällä tapahtuvaan prosessointiin ja hyödyntää modulaatiospektrogrammiksi (engl. Modulation Spectrogram) kutsuttua äänten esitystapaa äänten erottelussa. Se osoittautui perinteisiä menetelmiä tehokkaammaksi äänten erottelussa erityisesti sellaisissa tilanteissa, joissa erottelun kohteesta ei ole saatavilla opetusdataa jonka avulla erottelualgoritmia kehitetään.

Yksi Tom Barkerin tutkimuksen tuloksista oli matalat viivevaatimukset täyttävä äänten erottelutekniikka, joka soveltuu erityisesti kuulolaitteisiin. Tekniikka kehitettiin yhteistyössä Tanskassa sijaitsevan Eriksholmin tutkimuskeskuksen kanssa, joka tunnetaan yhtenä kuulotutkimuksen pioneereista.

– Äänilähteiden toimiva erottelu on kuulolaitteissa tärkeää. Monet kuulolaitteet toimivat huonommin silloin, kun äänilähteitä on monta. Tällaisia ovat useat arkiset tilanteet, vaikkapa ravintolaympäristö. Paremmilla äänten erottelualgoritmeilla kuulorajoitteiset pystyvät kommunikoimaan helpommin, Barker kertoo.

– Teknologiasta olisi hyötyä myös älykaiuttimissa, musiikin ja lähetysten laatua käsittelevissä sovelluksissa sekä tietoliikennetekniikassa hyödynnettävässä puheen ehostuksessa.

Väitöstilaisuus 24.5.2017

Diplomi-insinööri Tom Barkerin signaalinkäsittelyn alaan kuuluva väitöskirja Non-negative factorisation techniques for sound source separation tarkastetaan julkisesti Tampereen teknillisen yliopiston (TTY) tieto- ja sähkötekniikan tiedekunnassa keskiviikkona 24.5.2017 kello 12 alkaen Tietotalon salissa TB109 (Korkeakoulunkatu 1, Tampere). Vastaväittäjinä toimivat professori Tom Bäckström (Aalto-yliopisto) ja tohtori Antoine Liutkus (Inria, Nancy, France). Tilaisuutta valvoo professori Tuomas Virtanen TTY:n signaalinkäsittelyn laboratoriosta.

Tom Barker (30) on kotoisin Norwichistä, Englannista ja työskentelee tutkijana audiotutkimusryhmässä TTY:n signaalinkäsittelyn laboratoriossa.

Lisätiedot: Tom Barker, puh. 040 218 1167, thomas.barker (at) tut.fi

Uutisen jättäjä: Sanna Kähkönen
Asiasanat: tiede ja tutkimus, signaalinkäsittely