Zaključna konferenca MEZZANINE
Okrogla miza Govorni viri in govorne tehnologije v raziskavah
Ljubljana, Fakulteta za računalništvo in informatiko, 18. september 2025
Vodja: Nikola Ljubešić
Sodelujoči: Andrej Žgank, Marko Bajec, Darinka Verdonik, Gordana Hržica, Simon Dobrišek, Karmen Kenda Jež in drugi udeleženci konferenci Govorjeni jezik med raziskovanjem in tehnologijo
Povzetki razprave
- Obseg in vrsta podatkov: potrebujemo tako velike splošne zbirke kot specializirane korpuse (npr. otroški govor, narečja, spontani pogovori).
- Dostopnost podatkov: poleg govornih zbirk, izdanih v repozitoriju CLARIN.SI, je treba poskrbeti za skupen nacionalni arhiv govorne produkcije v medijih.
- Tehnološka podpora: pomembna je tehnološka podpora za zbiranje posnetkov, avtomatsko segmentiranje, anotiranje in transkribiranje posnetkov, orodja za anonimizacijo posnetkov, orodja za različne vrste analiz govornih podatkov.
- Pravna in etična vprašanja: pri uporabi posnetkov je treba spoštovati zasebnost govorcev in zagotoviti, da se s podatki ravna skladno z zakonodajo (avtorsko pravo, osebni podatki).
- Interdisciplinarno sodelovanje: jezikoslovci različnih disciplin, računalničarji, logopedi, psihologi, politologi in drugi raziskovalci se morajo povezati, da bodo podatki uporabni za različne stroke.
Sklep: Vsi udeleženci so poudarili, da so govorni podatki ključni za prihodnost jezikoslovnih raziskav, logopedskih obravnav in govornih tehnologij ter da je potrebno še tesnejše sodelovanje – interdisciplinarno in mednarodno.