FONETIIKAN PÄIVÄT 2002


    Puhujaprofiilin kehittäminen

    Antti Iivonen, Kirsi Harinen, Mari Horppila, Leena Keinänen, Hanna Liisanantti, Einar Meister, Leena Perälä, Launo Tuuri & Liisa Vilhunen

    Helsingin yliopisto


       Puhujaprofiili tähtää puhujan yksilöllisten akustisten piirteiden mittaamiseen äänitiedostosta. Perusongelmana on, voidaanko kullekin puhujalle muodostaa sellainen moniparametrinen profiili, joka erottaa puhujan muista puhujista. Kun aineisto voidaan prosessoida teknisesti opimaalisesti ja puhuja pyrkii itse tunnistamisen onnistumiseen, on kyseessä (a) puhujan verifikaatio (todentaminen). Kun tavoitteena on vastata vain kysymykseen, ovatko kaksi vertailtavaa puhujaa sama vai eri puhuja, on kyseessä (b) puhujien diskriminaatio (erottelu). Kun valmiiksi laskettujen puhujaprofiilien joukosta pyritään löytämään uuden puhujan profiilia eniten vastaava profiili, on kysymyksessä on (c) puhujien maksimaalisen samankaltaisuuden osoittaminen. Jos samankaltaisuuden arviointiin liittyy myös uuden ja maksimaalisesti samankaltaisen puhujan vertailuun kehitetyn todennäköisyysalgoritmin soveltaminen, kyseessä on (d) puhujantunnistus (speaker recognition). Esitelmässä käsitellään vain puhujaprofiilin kehittämistä puhujantunnistusta koskevassa erityishankkeessa. Ko. hankkeessa käsitellään lisäksi ongelmaa, miten puhujan äidinkieli (viro, venäjä tai ruotsi) ilmenee puhujaprofiilissa, jos hän puhuu suomea.
       Puhujaprofiilin kehittämiseksi on kerätty puhujatietokanta, joka käsittää suomenkielistä kännykkäpuhetta yli 200 puhujalta eri puolilta Suomea. Noin puolet aineistosta on tallennettu Soneran palvelimen kautta hankkeen serverikoneeseen ja puolet suoraan kannettavaan tietokoneeseen. Puhujien joukossa on myös äidinkieleltään ruotsin-, viron- ja venäjänkielisiä puhujia. Myös vironkielinen Babel-tietokanta on käytettävissä. Vertailuja varten on kerätty myös teknisesti korkealuokkaisella äänitysvälineistöllä aineisto ja täsmälleen sama aineisto on tallennettu myös kännykkäpuheena. Puhujaprofiilin kehittämisen perustana ovat Praat-analyysiohjelma, sillä laaditut skriptit ja mahdollisimman automaattinen laskentarutiini. Toisaalta pidetään silmällä sellaisia laskenta-algoritmeja ja (osin manuaalisuutta vaativia) parametrejä, joita ei Praatissa ole. Erityistä huomiota on kiinnitetty erilaisiin tuloksiin vaikuttaviin tekijöihin ja virhelähteisiin (esimerkiksi perustaajuuden laskennan ongelmiin, analyysioptioiden valintaan, parametrien saturaatioon ja robustisuuteen sekä puhetyylin vaikutuksiin).
       Esitelmä liittyy Puhujantunnistushankkeeseen osana Suomenkielisen puheteknologian yhteishanketta (SuoPuhe TEKES 40285/00, 40406/01, 40238/02, HY 460325).
       Aihetta on käsitelty aiemmin Fonetiikan päivillä Turussa 2001: Antti Iivonen, Kirsi Harinen, Leena Keinänen, Hanna Liisanantti, Einar Meister, Launo Tuuri) Moniparametrinen puhujantunnistus. 21. fonetiikan päivät, Turku 4.-5.1.2001, 81-95. . Turun yliopiston suomalaisen ja yleisen kielitieteen laitoksen julkaisuja 67.