Väitöstiedotteet - Tampereen teknillinen yliopisto

Tietokone tunnistaa laulajan taiteilijanimen takaa

Tunnistamme vaivattomasti meille tutut laulajat, mutta tietokoneelle se on hankalampaa. Väitöskirjassaan Annamaria Mesaros esittelee musiikin automaattisen analysointimenetelmän, jonka avulla tietokonekin tunnistaa musiikkikappaleen laulajan sekä hänen laulamansa sanat.

Jokaisella meistä on suosikkilaulaja, jonka äänen tunnistamme nopeasti, lauloipa hän säestyksen kanssa tai ilman. Pystymme keskittymään helposti lauluääneen ja ymmärtämään kappaleen sanojen sisällön. Osaamme ulkoa useiden kappaleiden sanat. Tietokoneen näkökulmasta musiikki sisältää useita äänilähteitä, joiden automaattinen erottelu ja tunnistaminen on vaikeaa.

Annamaria Mesaros esittelee väitöstyössään menetelmiä, joiden avulla tietokone voi tunnistaa laulajan musiikkikappaleesta. Menetelmillä tunnistaa laulajan identiteetin, vaikka hän esiintyisi eri taitelijanimillä tai eri yhtyeessä.

–Käyttäjä voi esimerkiksi hakea musiikkitietokannasta kaikkia kappaleita, jossa Tarja Turunen laulaa. Hakuvastauksena hän saisi kappaleet, joista osa on yhtyeeltä, osa “Maailman Kauneimmat Joululaulut”-levyltä, osa Turusen soolouralta ja osa oopperauralta. Menetelmä on käyttökelpoinen esimerkiksi musiikin lajittelussa, selventää Mesaros.

Automaattiset laulunsanojen tunnistusmenetelmät eivät vielä täysin yllä tarkkuudessaan sille tasolle, jolla ihminen pystyy tunnistamaan tutulla kielellä lauletut sanat. Tarkkuus on kuitenkin sen verran hyvä, että jos laulun sanat ovat menetelmän tiedossa, voidaan musiikki ja laulun sanat synkronoida saumattomasti yhteen. Tällöin menetelmä tuottaa tarkat aikaleimat siitä, missä kohtaa musiikkikappaletta mikäkin sana laulettiin.

–Tätä menetelmää voidaan käyttää karaokevideoiden luomiseen automaattisesti. Menetelmällä voidaan näyttää laulun sanat oikeaan aikaan karaokelaulajalle vaivattomasti, havainnollistaa Annamaria Mesaros.

Väitöstilaisuus tiistaina 4.9.

Diplomi-insinööri Annamaria Mesarosin väitöskirja “Singing Voice Recognition for Music Information Retrieval" (Lauluäänen tunnistusmenetelmät musiikin tiedonhakuun) tarkastetaan Tampereen teknillisen yliopiston (TTY) tieto- ja sähkötekniikan tiedekunnassa tiistaina 4.9.2012 kello 12 Tietotalon salissa TB103 (Korkeakoulunkatu1,Tampere).

Vastaväittäjinä toimivat professori Gaël Richard (TELECOM ParisTech, Ranska) ja Dr. Olivier Lartillot (Jyväskylän yliopisto). Tilaisuutta valvoo dosentti Tuomas Virtanen TTY:n signaalinkäsittelyn laitokselta.

Annamaria Mesaros (33) onkotoisin Romaniasta ja työskentelee tutkijana Aalto-yliopistossa.

Lisätietoja: Annamaria Mesaros, puh. 044 281 9594, annamaria.mesaros@aalto.fi


 

Uutisen jättäjä: Kemiläinen Marjut
Asiasanat: tiede ja tutkimus, näkyvyys ja viestintä, väitös, signaalinkäsittely, musiikki, laulaja, säestys, tunnistus, mesaros