Projekt
MEZZANINE
Temeljne raziskave za razvoj govornih virov in tehnologij za slovenski jezik (MEZZANINE – teMeljnE raZiskave Za rAzvoj govorNih vIrov in tehNologij za slovEnščino, J7-4642) je veliki temeljni raziskovalni projekt, ki ga financira Agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije in traja od oktobra 2022 do konca septembra 2025. V tem interdisciplinarnem projektu sodelujejo korpusni jezikoslovci, dialektologi, fonetiki, leksikografi, sociolingvisti, jezikovni tehnologi in drugi raziskovalci s skupnim glavnim ciljem strateškega in učinkovitejšega razvoja prostodostopnih govornih virov. Ti viri so nujno potrebni za poglobljene in širše veljavne raziskave govorjenega jezika v številnih disciplinah, od fonetike, fonologije in dialektologije do slovnice, leksikografije in sociolingvistike ter na drugi strani govornih tehnologij.
Med rezultati projekta načrtujemo tehnične smernice za snemanje, standardizacijo narečnih fonemov, označevanje govornih korpusov na različnih ravneh ter obravnavo govorjene leksike v leksikografskih virih. Prav tako bodo izdelani cevovod za avtomatsko jezikoslovno označevanje govornih korpusov ter diahrone in sinhrone fonetične (narečne) karte. Leksikon slovenskih besed Sloleks bo razširjen s podatki za govorjeno leksiko. Izdelan bo učni korpus z ročno dodanimi oznakami prozodičnih enot, netekočnosti in dialoških dejanj. Opravljene temeljne raziskave s področja govornih virov, pristopov k snemanju in zapisovanju govora, avtomatskega razpoznavanja slovenskega govora, dialektologije, prozodičnih enot, netekočnosti v govoru, oblikoskladenjskega označevanja, lematizacije in skladenjskega razčlenjevanja, dialoških dejanj, kanoničnih oblik nestandardne govorjene leksike in njenega leksikografskega opisa bodo predstavljene v izvirnih znanstvenih publikacijah. Rezultatom lahko sledite na https://mezzanine.um.si/rezultati/.