Zaključna konferenca MEZZANINE

Okrogla miza Govorni viri in govorne tehnologije v raziskavah

Ljubljana, Fakulteta za računalništvo in informatiko, 18. september 2025

Vodja: Nikola Ljubešić

Sodelujoči: Andrej Žgank, Marko Bajec, Darinka Verdonik, Gordana Hržica, Simon Dobrišek, Karmen Kenda Jež in drugi udeleženci konferenci Govorjeni jezik med raziskovanjem in tehnologijo

Povzetki razprave 

  • Obseg in vrsta podatkov: potrebujemo tako velike splošne zbirke kot specializirane korpuse (npr. otroški govor, narečja, spontani pogovori).
  • Dostopnost podatkov: poleg govornih zbirk, izdanih v repozitoriju CLARIN.SI, je treba poskrbeti za skupen nacionalni arhiv govorne produkcije v medijih.
  • Tehnološka podpora: pomembna je tehnološka podpora za zbiranje posnetkov, avtomatsko segmentiranje, anotiranje in transkribiranje posnetkov, orodja za anonimizacijo posnetkov, orodja za različne vrste analiz govornih podatkov.
  • Pravna in etična vprašanja: pri uporabi posnetkov je treba spoštovati zasebnost govorcev in zagotoviti, da se s podatki ravna skladno z zakonodajo (avtorsko pravo, osebni podatki).
  • Interdisciplinarno sodelovanje: jezikoslovci različnih disciplin, računalničarji, logopedi, psihologi, politologi in drugi raziskovalci se morajo povezati, da bodo podatki uporabni za različne stroke.

Sklep: Vsi udeleženci so poudarili, da so govorni podatki ključni za prihodnost jezikoslovnih raziskav, logopedskih obravnav in govornih tehnologij ter da je potrebno še tesnejše sodelovanje – interdisciplinarno in mednarodno.