Antti Iivonen, Kirsi Harinen, Mari Horppila, Leena Keinänen, Hanna
Liisanantti, Einar Meister, Leena Perälä, Launo Tuuri & Liisa Vilhunen
Puhujaprofiili tähtää puhujan yksilöllisten akustisten piirteiden
mittaamiseen äänitiedostosta. Perusongelmana on, voidaanko kullekin
puhujalle muodostaa sellainen moniparametrinen profiili, joka erottaa
puhujan muista puhujista. Kun aineisto voidaan prosessoida teknisesti
opimaalisesti ja puhuja pyrkii itse tunnistamisen onnistumiseen, on
kyseessä (a) puhujan verifikaatio (todentaminen). Kun tavoitteena on
vastata vain kysymykseen, ovatko kaksi vertailtavaa puhujaa sama vai eri
puhuja, on kyseessä (b) puhujien diskriminaatio (erottelu). Kun valmiiksi
laskettujen puhujaprofiilien joukosta pyritään löytämään uuden puhujan
profiilia eniten vastaava profiili, on kysymyksessä on (c) puhujien
maksimaalisen samankaltaisuuden osoittaminen. Jos samankaltaisuuden
arviointiin liittyy myös uuden ja maksimaalisesti samankaltaisen puhujan
vertailuun kehitetyn todennäköisyysalgoritmin soveltaminen, kyseessä on (d)
puhujantunnistus (speaker recognition). Esitelmässä käsitellään vain
puhujaprofiilin kehittämistä puhujantunnistusta koskevassa
erityishankkeessa. Ko. hankkeessa käsitellään lisäksi ongelmaa, miten
puhujan äidinkieli (viro, venäjä tai ruotsi) ilmenee puhujaprofiilissa, jos
hän puhuu suomea.
Puhujaprofiilin kehittämiseksi on kerätty puhujatietokanta, joka käsittää
suomenkielistä kännykkäpuhetta yli 200 puhujalta eri puolilta Suomea. Noin
puolet aineistosta on tallennettu Soneran palvelimen kautta hankkeen
serverikoneeseen ja puolet suoraan kannettavaan tietokoneeseen. Puhujien
joukossa on myös äidinkieleltään ruotsin-, viron- ja venäjänkielisiä
puhujia. Myös vironkielinen Babel-tietokanta on käytettävissä. Vertailuja
varten on kerätty myös teknisesti korkealuokkaisella äänitysvälineistöllä
aineisto ja täsmälleen sama aineisto on tallennettu myös kännykkäpuheena.
Puhujaprofiilin kehittämisen perustana ovat Praat-analyysiohjelma, sillä
laaditut skriptit ja mahdollisimman automaattinen laskentarutiini.
Toisaalta pidetään silmällä sellaisia laskenta-algoritmeja ja (osin
manuaalisuutta vaativia) parametrejä, joita ei Praatissa ole. Erityistä
huomiota on kiinnitetty erilaisiin tuloksiin vaikuttaviin tekijöihin ja
virhelähteisiin (esimerkiksi perustaajuuden laskennan ongelmiin,
analyysioptioiden valintaan, parametrien saturaatioon ja robustisuuteen
sekä puhetyylin vaikutuksiin).
Esitelmä liittyy Puhujantunnistushankkeeseen osana Suomenkielisen
puheteknologian yhteishanketta (SuoPuhe TEKES 40285/00, 40406/01, 40238/02,
HY 460325).
Aihetta on käsitelty aiemmin Fonetiikan päivillä Turussa 2001:
Antti Iivonen, Kirsi Harinen, Leena Keinänen, Hanna Liisanantti, Einar Meister,
Launo Tuuri) Moniparametrinen puhujantunnistus. 21. fonetiikan päivät,
Turku 4.-5.1.2001, 81-95. . Turun yliopiston suomalaisen ja yleisen
kielitieteen laitoksen julkaisuja 67.
|
|
|