Zaključna konferenca MEZZANINE
Govorjeni jezik med raziskovanjem in tehnologijo
18. september 2025
Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
Večna pot 113, 1000 Ljubljana
Vljudno vas vabimo na zaključno konferenco projekta MEZZANINE. Konferenca bo združila jezikoslovce, tehnične strokovnjake in raziskovalce z različnih področij, da bi skupaj osvetlili ključne izzive, povezane z govorjenim jezikom. Vabljeni kot avtorji lastnih prispevkov ali obiskovalci. Konferenca je brezplačna in odprta za obiskovalce brez predhodne prijave.
Tematska področja
- Govorni viri v jezikoslovju in tehničnih znanostih
- Vrste govornih podatkov in njihovo avtomatizirano zbiranje
- Potrebe različnih znanstvenih disciplin po govornih podatkih
- Metode vključevanja občanov v zbiranje govornih podatkov
- Narečna variabilnost
- Prostorska razporeditev glasov v slovenskih narečjih
- Prilagoditev avtomatskega razpoznavanja govora za slovenska narečja
- Segmentacija in označevanje govora
- Razvoj označevalnih shem za govor
- Samopopravljanje, obotavljanje in prozodične značilnosti govora
- Avtomatsko označevanje oblikoslovnih in skladenjskih lastnosti govora
- Govorjena leksika
- Avtomatska obdelava glasovne podobe besed
- Luščenje govorjenega besedja za slovenske slovarje
- Razlike med govorjenim in pisnim besedjem
Programski odbor
- Darinka Verdonik, UM FERI
- Nikola Ljubešić, IJS
Organizacijski odbor
- Špela Antloga, UM FERI
- Sara Kos, UL FRI
- Nejc Robida, UL FF
- Jaka Čibej, UL FF
Zbornik povzetkov
Zbornik povzetkov s konference Govorjeni jezik med raziskovanjem in tehnologijo prinaša aktualne prispevke s presečišča govorjenih jezikovnih virov, jezikoslovja in govornih tehnologij. Predstavljeni so javno dostopni hrvaški otroški korpusi v CHILDES/TalkBank ter zbirka ParlaSpeech V3. Več prispevkov obravnava gradnjo in obdelavo govornih virov za slovenščino: od strategij občanske znanosti in odprtokodnih orodij (poravnava, anonimizacija, validacija, normalizacija) do fonetičnega zapisa v Digitalni slovarski bazi ter širjenja slovarskih virov z govorjenim besediščem. Raziskave segajo od (ne)tekočnosti in detekcije zapolnjenih premorov do razmerja med prozodičnimi in stavčnimi enotami ter izzivov narečne transkripcije; napovedan je tudi novi korpus zgodnje komunikacije EPIC-SI. Zbornik je odprtodostopen pod licenco CC BY-SA in je namenjen raziskovalcem jezikoslovja in govornih tehnologij ter širši strokovni skupnosti.
