Zaključna konferenca MEZZANINE

Govorjeni jezik med raziskovanjem in tehnologijo

18. september 2025

Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
Večna pot 113, 1000 Ljubljana

Vljudno vas vabimo na zaključno konferenco projekta MEZZANINE. Konferenca bo združila jezikoslovce, tehnične strokovnjake in raziskovalce z različnih področij, da bi skupaj osvetlili ključne izzive, povezane z govorjenim jezikom. Vabljeni kot avtorji lastnih prispevkov ali obiskovalci. Konferenca je brezplačna in odprta za obiskovalce brez predhodne prijave.

Tematska področja

  1. Govorni viri v jezikoslovju in tehničnih znanostih
    • Vrste govornih podatkov in njihovo avtomatizirano zbiranje
    • Potrebe različnih znanstvenih disciplin po govornih podatkih
    • Metode vključevanja občanov v zbiranje govornih podatkov
  2. Narečna variabilnost
    • Prostorska razporeditev glasov v slovenskih narečjih
    • Prilagoditev avtomatskega razpoznavanja govora za slovenska narečja
  3. Segmentacija in označevanje govora
    • Razvoj označevalnih shem za govor
    • Samopopravljanje, obotavljanje in prozodične značilnosti govora
    • Avtomatsko označevanje oblikoslovnih in skladenjskih lastnosti govora
  4. Govorjena leksika
    • Avtomatska obdelava glasovne podobe besed
    • Luščenje govorjenega besedja za slovenske slovarje
    • Razlike med govorjenim in pisnim besedjem

Programski odbor

  • Darinka Verdonik, UM FERI
  • Nikola Ljubešić, IJS

Organizacijski odbor

  • Špela Antloga, UM FERI 
  • Sara Kos, UL FRI
  • Nejc Robida, UL FF
  • Jaka Čibej, UL FF

Zbornik povzetkov

Zbornik povzetkov s konference Govorjeni jezik med raziskovanjem in tehnologijo prinaša aktualne prispevke s presečišča govorjenih jezikovnih virov, jezikoslovja in govornih tehnologij. Predstavljeni so javno dostopni hrvaški otroški korpusi v CHILDES/TalkBank ter zbirka ParlaSpeech V3. Več prispevkov obravnava gradnjo in obdelavo govornih virov za slovenščino: od strategij občanske znanosti in odprtokodnih orodij (poravnava, anonimizacija, validacija, normalizacija) do fonetičnega zapisa v Digitalni slovarski bazi ter širjenja slovarskih virov z govorjenim besediščem. Raziskave segajo od (ne)tekočnosti in detekcije zapolnjenih premorov do razmerja med prozodičnimi in stavčnimi enotami ter izzivov narečne transkripcije; napovedan je tudi novi korpus zgodnje komunikacije EPIC-SI. Zbornik je odprtodostopen pod licenco CC BY-SA in je namenjen raziskovalcem jezikoslovja in govornih tehnologij ter širši strokovni skupnosti.