Rezultati
Načrtovani rezultati projekta vključujejo izvirne znanstvene objave, tehnične elaborate oz. smernice, uporabne storitve, podatkovne zbirke in korpuse.
Dogodki
Prva interna delavnica MEZZANINE
Kraj, čas: ZRC SAZU, 14. 4. 2023, 9h do 13h
Udeleženci: Sodelavci projekta MEZZANINE
Vsebina: Slovenski lingvistični atlas kot vir podatkov o prostorski razporeditvi slovenskega nestandardnega glasovja, novosti poglavja Glasoslovni oris v Pravopisu 8.0., analize prozodije v Praatu, Sloleks in govorjena slovenščina, Avtomatsko razpoznavanje govora, označevanje govornih gradiv
6. mednarodna znanstvena konferenca Slavistični znanstveni premisleki: Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah
Kraj, čas: Filozofska fakulteta Univerze v Mariboru, 18. in 19. 5. 2023
Udeleženci: Vabljenipredavatelji Mojca Smolej, Vesna Mikolič, Radovan Garabik, Peter Jurgec, sodelavci projekta MEZZANINE, drugi raziskovalci slovenščine in južnoslovanskih jezikov
Vsebina: Glej zbornik povzetkov (https://mezzanine.um.si/konference/6-mednarodna-znanstvena-konferenca-slavisticni-znanstveni-premisleki/#zbornik)
SemDial – MariLogue, 27. delavnica o semantiki in pragmatiki dialoga
Kraj, čas: Fakulteta za elektrotehniko, računalništvo in informatiko Univerze v Mariboru, 16. in 17. 8. 2023
Udeleženci: Raziskovalci s področja semantike in pragmatike dialoga z vsega sveta
Vsebina: Glej zbornik prispevkov (https://mezzanine.um.si/en/conference/semdial-2023-marilogue/#proceedings)
Druga interna delavnica MEZZANINE
Kraj, čas: Fakulteta za računalništvo in informatiko Univerze v Ljubljani, 19. 9. 2023 od 9:30 do 14:00
Udeleženci: Sodelavci projekta MEZZANINE
Vsebina: Govorni viri Artur, Gos 2.0 in učni korpus govorjene slovenščine; lematizacija in označevanje MSD v govornih virih; segmentacija govora na osnovne enote; skladenjsko označevanje govora; postopke za razrez na foneme in besede za namene prozodičnih analiz
Tretja interna delavnica MEZZANINE
Kraj, čas: Fakulteta za računalništvo in informatiko Univerze v Ljubljani, 13. 2. 2024 od 9:00 do 14:00
Udeleženci: Sodelavci projekta MEZZANINE
Vsebina: označevanje netekočnosti v korpusu Iriss z orodjem Exmaralda; uporaba orodij avtomatske segmentacije, razpoznave govorca in razpoznave govora za polavtomatsko transkribiranje govora; ParlaSpeech; korpusne oznake za opis konteksta govornih dogodkov; fonetični modul geolingvistične aplikacije DIAtlas; samodejni razrez korpusa Gos 2.1 in uporaba strojnih akustičnih meritev
Strokovni panel Napredki in perspektive v raziskavah govorne komunikacije
Dogodek je potekal na konferenci Jezikovne tehnologije in digitalna humanistika 2024 19. septembra na Fakulteti za elektrotehniko v Ljubljani. Posnetek in več informacij (https://www.sdjt.si/wp/jtdh-2024/#panel)
Četrta interna delavnica Mezzanine
Kraj, čas: Institut Jožef Stefan, 22. 10. 2024 od 9.30 do 13.30
Udeleženci: Sodelavci projekta MEZZANINE
Vsebina: učni korpus ROG – predstavitev različnih nivojev ročnih oznak, avtomatska detekcija zapolnjenih premorov, digitalna slovarska baza
Izvirne znanstvene objave
1.01 Izvirni znanstveni članek
VERDONIK, Darinka. Primarne kategorije dialoških dejanj. Slavistična revija : časopis za jezikoslovje in literarne vede. [Tiskana izd.]. 2023, letn. 71, št. 1, str. 43-60. ISSN 0350-6894. https://srl.si/ojs/srl/article/view/4062, DOI: 10.57589/srl.v71i1.4062. [COBISS.SI-ID 151811075], [SNIP, Scopus]
SEPESY MAUČEC, Mirjam, VERDONIK, Darinka, DONAJ, Gregor. Sequence-to-Sequence models and their evaluation for spoken language normalization of Slovenian. Applied sciences. Oct. 2024, vol. 14, iss. 20, [article no.] 9515, 24 str. ISSN 2076-3417. DOI: 10.3390/app14209515. [COBISS.SI-ID 213048067], [JCR, SNIP, WoS, Scopus]
BIZJAK, Andreja. Korpusne oznake za opis konteksta govornih dogodkov v slovenskih govornih korpusih. Slovenščina 2.0 : empirične, aplikativne in interdisciplinarne raziskave. 2024, letn. 12, št. 1, str. 54-94, ilustr. ISSN 2335-2736. https://journals.uni-lj.si/slovenscina2/article/view/18015/16273, Digitalna knjižnica Univerze v Mariboru – DKUM, dCOBISS, DOI: 10.4312/slo2.0.2024.1.54-94. [COBISS.SI-ID 206755331], [Odprti dostop, SNIP, Scopus]
VERDONIK, Darinka, BIZJAK, Andreja, ŽGANK, Andrej, SEPESY MAUČEC, Mirjam, TROJAR, Mitja, ŽGANEC GROS, Jerneja, BAJEC, Marko, LEBAR BAJEC, Iztok, DOBRIŠEK, Simon. Strategies for managing time and costs in speech corpus creation : insights from the Slovenian ARTUR corpus. Language resources and evaluation. [Online ed.]. Published: 30 November 2024, 26 str., ilustr. ISSN 1574-0218. https://link.springer.com/article/10.1007/s10579-024-09746-8#article-info, DOI: 10.1007/s10579-024-09792-2. [COBISS.SI-ID 217959427]
1.04 Strokovni članek
TERČON, Luka, LJUBEŠIĆ, Nikola. CLASSLA-Stanza : the next step for linguistic processing of South Slavic languages. ArXiv.org. [in press] 2023, eprint 2308.04255. ISSN 2331-8422. https://arxiv.org/abs/2308.04255, DOI: 10.48550/arXiv.2308.04255. [COBISS.SI-ID 187571459]
1.08 Objavljeni znanstveni prispevek na konferenci
VERDONIK, Darinka, BIZJAK, Andreja, ŽGANK, Andrej, DOBRIŠEK, Simon. Metapodatki o posnetkih in govorcih v govornih virih: primer baze Artur. V: FIŠER, Darja (ur.), ERJAVEC, Tomaž (ur.). Jezikovne tehnologije in digitalna humanistika : zbornik konference : 15.-16. september 2022, Ljubljana, Slovenija = Proceedings of the Conference on Language Technologies and Digital Humanities : September 15th-16th 2022, Ljubljana, Slovenia. 1st ed. Ljubljana: Inštitut za novejšo zgodovino: = Institute of Contemporary History, 2022. Str. 205-212. ISBN 978-961-7104-20-2. https://nl.ijs.si/jtdh22/pdf/JTDH2022_Proceedings.pdf. [COBISS.SI-ID 124488451]
AEPLI, Noëmi, ÇÖLTEKIN, Çagrı, LJUBEŠIĆ, Nikola, ZAMPIERI, Marcos, et al. Findings of the VarDial Evaluation Campaign 2023. V: SCHERRER, Yves (ur.), et al. The Tenth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial 2023) : proceedings of the workshop : [Dubrovnik], May 5, 2023. Stroudsburg: Association for Computational Linguistics, cop. 2023. Str. 251-261, tabele. ISBN 978-1-959429-50-0. https://aclanthology.org/2023.vardial-1.25.pdf, DOI: 10.18653/v1/2023.vardial-1.25. [COBISS.SI-ID 173399299]
KUZMAN, Taja, RUPNIK, Peter, LJUBEŠIĆ, Nikola. Get to know your parallel data : performing English variety and genre classification over MaCoCu Corpora. V: SCHERRER, Yves (ur.), et al. The Tenth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial 2023) : proceedings of the workshop : [Dubrovnik], May 5, 2023. Stroudsburg: Association for Computational Linguistics, cop. 2023. Str. 91-103, ilustr. ISBN 978-1-959429-50-0. https://aclanthology.org/2023.vardial-1.9.pdf, DOI: 10.18653/v1/2023.vardial-1.9. [COBISS.SI-ID 173393411]
OGRODNICZUK, Maciej, OSENOVA, Petja, ERJAVEC, Tomaž, FIŠER, Darja, LJUBEŠIĆ, Nikola, ÇÖLTEKIN, Çagrı, KOPP, Matyáš, MEDEN, Katja, KUZMAN, Taja. The ParlaMint Project : ever-growing family of comparable and interoperable parliamentary corpora. V: LINDÉN, Krister (ur.), NIEMI, Jyrki (ur.), KONTINO, Thalassia (ur.). CLARIN annual conference proceedings 2023 : 16 – 18 October 2023 Leuven, Belgium. [S. l.: s. n.], 2023. Str. 62-66, ilustr. CLARIN Annual Conference Proceedings. ISSN 2773-2177. https://office.clarin.eu/v/CE-2023-2328_CLARIN2023_ConferenceProceedings.pdf. [COBISS.SI-ID 169470211]
BAJEC, Marko, LEBAR BAJEC, Iztok, ŠOLTES, Tjaša, CVEK, Jernej, ČIBEJ, Jaka, GANTAR, Kaja, SEVER, Sara, KREK, Simon. Online Notes – a real-time speech recognition and machine translation system for Slovene university lectures. V: DEBEVC, Matjaž (ur.), KOŽUH, Ines (ur.). Digitalna vključenost v informacijski družbi = Digital Inclusion in Information Society : Informacijska družba – IS 2023 = Information Society – IS 2023 : zbornik 26. mednarodne multikonference = proceedings of the 26th International Multiconference : zvezek H = volume H : 11. oktober 2023, 11 October 2023, Ljubljana, Slovenia. Ljubljana: Institut “Jožef Stefan”, 2023. Str. 7-10, ilustr. Informacijska družba. ISBN 978-961-264-280-8. ISSN 2630-371X. https://is.ijs.si/wp-content/uploads/2023/11/IS2023_Volume-H.pdf. [COBISS.SI-ID 172807683]
ŠOLTES, Tjaša, BAJEC, Marko, LEBAR BAJEC, Iztok, GANTAR, Kaja, ŽITNIK, Slavko. Online-notes system : real-time speech recognition and translation of lectures. V: NURCAN, Selmin (ur.). Research challenges in information science : information science and the connected world : 17th International Conference, RCIS 2023, Corfu, Greece, May 23–26, 2023 : proceedings. Cham: Springer, cop. 2023. Str. 485-492, ilustr. Lecture notes in business information processing (Internet), 476. ISBN 978-3-031-33080-3. ISSN 1865-1356. https://link.springer.com/chapter/10.1007/978-3-031-33080-3_29, DOI: 10.1007/978-3-031-33080-3_29. [COBISS.SI-ID 157601539], [SNIP, Scopus]
SEPESY MAUČEC, Mirjam, VERDONIK, Darinka, DONAJ, Gregor. Analiza napak pretvornika pogovornega zapisa govora v standardizirani zapis. V: ŽEMVA, Andrej (ur.), TROST, Andrej (ur.). Zbornik triintridesete mednarodne Elektrotehniške in računalniške konference ERK 2024 = Proceedings of the 33rd International Electrotechnical and Computer Science Conference ERK 2024 : Portorož, Slovenija, 26. – 27. september 2024. Ljubljana: Slovenska sekcija IEEE: Fakulteta za elektrotehniko, 2024. Str. 526-529, ilustr. Zbornik … Elektrotehniške in računalniške konference (Online), 33. ISSN 2591-0442. https://erk.fe.uni-lj.si/2024. [COBISS.SI-ID 210645251]
VERDONIK, Darinka, DOBROVOLJC, Kaja, ERJAVEC, Tomaž, LJUBEŠIĆ, Nikola. Gos 2 : a new reference corpus of spoken Slovenian. V: CALZOLARI, Nicoletta (ur.). The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024) : main conference proceedings : 20-25 May, 2024, Torino, Italia. [Paris]: ELRA Language Resources Association (ELRA); [Stroudsburg]: International Committee on Computational Linguistics, cop. 2024. Str. 7825-7830, ilustr. International conference on computational linguistics, LREC proceedings. ISBN 978-2-493814-10-4. ISSN 2951-2093, ISSN 2522-2686. https://aclanthology.org/2024.lrec-main.691/. [COBISS.SI-ID 196938499]
KRIŽAJ, Janez, ŽGANEC GROS, Jerneja, DOBRIŠEK, Simon. Utilizing forced alignment for phonetic analysis of Slovene speech : Janez Križaj, Jerneja Žganec Gros, Simon Dobrišek. V: ARHAR HOLDT, Špela (ur.), ERJAVEC, Tomaž (ur.). Jezikovne tehnologije in digitalna humanistika : zbornik konference : 19.-20. september 2024, Ljubljana, Slovenija = Language technologies and digital humanities : proceedings of the conference : 19-20 September 2024, Ljubljana, Slovenia. 1. izd. Ljubljana: Inštitut za novejšo zgodovino: = Institute of Contemporary History, 2024. Str. 557-566, ilustr. ISBN 978-961-7104-40-0. https://zenodo.org/records/13912515, https://www.sdjt.si/wp/wp-content/uploads/2024/09/JT-DH_2024_Krizaj_Gros_Dobrisek.pdf, Repozitorij Univerze v Ljubljani – RUL. [COBISS.SI-ID 211915011], [Odprti dostop]
ČIBEJ, Jaka, MUNDA, Tina. Metoda polavtomatskega popravljanja lem in oblikoskladenjskih oznak na primeru učnega korpusa govorjene slovenščine ROG. V: ARHAR HOLDT, Špela (ur.), ERJAVEC, Tomaž (ur.). Jezikovne tehnologije in digitalna humanistika : zbornik konference : 19.-20. september 2024, Ljubljana, Slovenija = Language technologies and digital humanities : proceedings of the conference : 19-20 September 2024, Ljubljana, Slovenia. 1. izd. Ljubljana: Inštitut za novejšo zgodovino: = Institute of Contemporary History, 2024. Str. 66-86, ilustr. ISBN 978-961-7104-40-0. https://zenodo.org/records/13936390, DOI: 10.5281/zenodo.13936389. [COBISS.SI-ID 214863875], [Odprti dostop]
ČIBEJ, Jaka. Predicting pronunciation types in the Sloleks morphological lexicon of Slovene. V: MLADENIĆ, Dunja (ur.), GROBELNIK, Marko (ur.). Odkrivanje znanja in podatkovna skladišča – SiKDD = Data mining and data warehouses – SiKDD : Informacijska družba – IS 2024 = Information Society – IS 2024 : zbornik 27. mednarodne multikonference = proceedings of the 27th International Multiconference : zvezek C = volume C : 7. oktober 2024, 7 October 2024, Ljubljana, Slovenia. Ljubljana: Institut “Jožef Stefan”, 2024. Str. 23-26, tabele. Informacijska družba. ISBN 978-961-264-301-0. ISSN 2630-371X. https://is.ijs.si/wp-content/uploads/2024/11/IS2024_Volume-C.pdf, DOI: 10.70314/is.2024.sikdd.2. [COBISS.SI-ID 215529219]
kategorija: 4D (Z); tip dela je verificiral OSICH
VERDONIK, Darinka, LJUBEŠIĆ, Nikola, RUPNIK, Peter, DOBROVOLJC, Kaja, ČIBEJ, Jaka. Izbor in urejanje gradiv za učni korpus govorjene slovenščine ROG. V: ARHAR HOLDT, Špela (ur.), ERJAVEC, Tomaž (ur.). Jezikovne tehnologije in digitalna humanistika : zbornik konference : 19.-20. september 2024, Ljubljana, Slovenija = Language technologies and digital humanities : proceedings of the conference : 19-20 September 2024, Ljubljana, Slovenia. 1. izd. Ljubljana: Inštitut za novejšo zgodovino: = Institute of Contemporary History, 2024. Str. 469-484, tabele. ISBN 978-961-7104-40-0. https://zenodo.org/records/13936426, DOI: 10.5281/zenodo.13936425. [COBISS.SI-ID 216104963]
LJUBEŠIĆ, Nikola, GALANT, Nada, BENČINA, Sonja, ČIBEJ, Jaka, MILOSAVLJEVIĆ, Stefan, RUPNIK, Peter, KUZMAN, Taja. DIALECT-COPA : extending the standard translations of the COPA causal commonsense reasoning dataset to South Slavic dialects. V: SCHERRER, Yves (ur.). VarDial 2024 – The Eleventh Workshop on NLP for Similar Languages, Varieties and Dialects : proceedings of the workshop : [Mexico City, Mexico], June 20, 2024. Kerrville (TX): Association for Computational Linguistics, cop. 2024. Str. 89-98. ISBN 979-8-89176-104-9. https://aclanthology.org/2024.vardial-1.7.pdf. [COBISS.SI-ID 202856707]
1.12 Objavljeni povzetek znanstvenega prispevka na konferenci
KRAJNC IVIČ, Mira, ANTLOGA, Špela. Predlog izdelave korpusa humorja v govoru za slovenščino = Spoken Slovene corpus of humor : draft proposal. V: KRAJNC IVIČ, Mira (ur.). Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah : zbornik povzetkov : [6. mednarodna znanstvena konferenca Slavistični znanstveni premisleki : 18. 5.-19. 5. 2023, Maribor, Slovenija]. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2023. Str. 69-72. ISBN 978-961-286-735-5. https://press.um.si/index.php/ump/catalog/book/774. [COBISS.SI-ID 165263619]
ŠUMENJAK, Klara. Standardi transkribiranja narečnega korpusa GOKO = GOKO dialect corpus transcription standards. V: KRAJNC IVIČ, Mira (ur.). Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah : zbornik povzetkov : [6. mednarodna znanstvena konferenca Slavistični znanstveni premisleki : 18. 5.-19. 5. 2023, Maribor, Slovenija]. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2023. Str. 105-109. ISBN 978-961-286-735-5. https://press.um.si/index.php/ump/catalog/book/774. [COBISS.SI-ID 176452867]
VERDONIK, Darinka, TROJAR, Mitja, BIZJAK, Andreja. Prednosti in slabosti dvotirnega zapisovanja govora v slovenskih govornih virih = Advantages and Disadvantages of Two-level Speech Transcription in the Slovenian Speech Resources. V: KRAJNC IVIČ, Mira (ur.). Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah : zbornik povzetkov : [6. mednarodna znanstvena konferenca Slavistični znanstveni premisleki : 18. 5.-19. 5. 2023, Maribor, Slovenija]. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2023. Str. 111-114. ISBN 978-961-286-735-5. https://press.um.si/index.php/ump/catalog/book/774. [COBISS.SI-ID 158884355]
VERDONIK, Darinka, MAJHENIČ, Simona, BIZJAK, Andreja. Are metadiscourse dialogue acts a category on their own?. V: LÜCKING, Andy (ur.), MAZZOCCONI, Chiara (ur.), VERDONIK, Darinka (ur.). SemDial 2023 : MariLogue : proceedings of the 27th Workshop on the Semantics and Pragmatics of Dialogue : held at University of Maribor, Faculty of Electrical Engineering and Computer Science, the Internet, August 16–17 2023. Maribor: University of Maribor, Faculty of Electrical Engineering and Computer Science, 2023. Str. 178-180. Proceedings (SemDial). ISSN 2308-2275. https://mezzanine.um.si/wp-content/uploads/Marilogue_Proceedings1.pdf. [COBISS.SI-ID 173321219]
ČIBEJ, Jaka, ROBIDA, Nejc, KREK, Simon. Vključevanje nestandardnih vnosov v slovenske jezikovne vire z vidika jezikovnotehnoloških potreb = Inclusion of non-standard entries in Slovene language resources with regard to language technology needs. V: KRAJNC IVIČ, Mira (ur.). Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah : zbornik povzetkov. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2023. Str. 37-40. ISBN 978-961-286-735-5. https://press.um.si/index.php/ump/catalog/book/774. [COBISS.SI-ID 202210563]
1.16 Samostojni znanstveni sestavek ali poglavje v monografski publikaciji
VERDONIK, Darinka. Zbiranje gradiv za govorne korpuse med Scilo in Karibdo. V: ARHAR HOLDT, Špela (ur.), KREK, Simon (ur.). Razvoj slovenščine v digitalnem okolju. 1. izd. Ljubljana: Založba Univerze, 2023. Str. 15-37, ilustr. Sporazumevanje. ISBN 978-961-297-256-1. ISSN 2738-4527. https://ebooks.uni-lj.si/ZalozbaUL/catalog/view/522/852/9447. [COBISS.SI-ID 185550083]
VERDONIK, Darinka, TROJAR, Mitja, BIZJAK, Andreja. Prednosti in slabosti dvotirnega zapisovanja govora v slovenskih govornih virih. V: KRAJNC IVIČ, Mira (ur.). Stanje in perspektive uporabe govornih virov v raziskavah govora. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2024. Str. 63-79, ilustr. ISBN 978-961-286-882-6. https://press.um.si/index.php/ump/catalog/book/898/chapter/48, DOI: 10.18690/um.ff.4.2024.4. [COBISS.SI-ID 202752259]
ČIBEJ, Jaka, ROBIDA, Nejc, KREK, Simon. Nadgradnja Digitalne slovarske baze za slovenščino in Slovenskega oblikoslovnega leksikona Sloleks s podatki o govorjeni slovenščini : načrti in cilji. V: KRAJNC IVIČ, Mira (ur.). Stanje in perspektive uporabe govornih virov v raziskavah govora. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2024. Str. 27-39. ISBN 978-961-286-882-6. https://press.um.si/index.php/ump/catalog/book/898/chapter/46, DOI: 10.18690/um.ff.4.2024.2. [COBISS.SI-ID 203079683]
ROBIDA, Nejc, ČIBEJ, Jaka, KREK, Simon. Strojni razrez posnetkov iz korpusa govorjene slovenščine GOS 2.1 in fonetične meritve. V: ŠTUMBERGER, Saška (ur.). Predpis in norma v jeziku. 1. natis. Ljubljana: Založba Univerze, 2024. Str. 267-274, ilustr. Zbirka Obdobja, 43. ISBN 978-961-297-439-8. ISSN 1408-211X. https://centerslo.si/wp-content/uploads/2024/11/Robida-et-al._Obdobja-43.pdf, DOI: 10.4312/Obdobja.43.267-274. [COBISS.SI-ID 215451395], [Odprti dostop]
Strokovne objave in sekundarno avtorstvo
1.09 Objavljeni strokovni prispevek na konferenci
8. MAJHENIČ, Simona. No, tudi z diskurznimi označevalci lahko tolmači veliko povemo : Pomen tolmačenja diskurznih označevalcev. V: ZIDAR FORTE, Jana (ur.). Odvrženi plašč nevidnosti : jubilejni zbornik ob 50-letnici ZKTS. Ljubljana: Združenje konferenčnih tolmačev Slovenije, 2023. Str. 69-75. ISBN 978-961-96113-0-2. http://zkts.si/images/Zbornik_ZKTS50.pdf. [COBISS.SI-ID 138132483]
financer: ARRS, Projekt, J7-4642, SI, MEZZANINE – teMeljnE raZiskave Za rAzvoj govorNih vIrov in tehNologij za slovEnščino
1.20 Predgovor, uvodnik, spremna beseda
9. KRAJNC IVIČ, Mira. Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah : zbornik povzetkov = Infrastructure for speech research in the humanities and language technologies : book of abstracts. V: KRAJNC IVIČ, Mira (ur.). Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah : zbornik povzetkov : [6. mednarodna znanstvena konferenca Slavistični znanstveni premisleki : 18. 5.-19. 5. 2023, Maribor, Slovenija]. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2023. Str. 137-138. ISBN 978-961-286-735-5. https://press.um.si/index.php/ump/catalog/book/774. [COBISS.SI-ID 165772035]
3.15 Prispevek na konferenci brez natisa
29. MAJHENIČ, Simona. Cognitive discourse markers in simultaneous interpreting : predavanje na konferenco na Université Paris Cité z naslovom “Discourse Markers – Theories and Methods”, Pariz, Francija, 25. 5. 2023. [COBISS.SI-ID 174052355]
financer: ARRS, Projekt, J7-4642, SI, MEZZANINE – teMeljnE raZiskave Za rAzvoj govorNih vIrov in tehNologij za slovEnščino
Urednik
KRAJNC IVIČ, Mira (urednik). Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah : zbornik povzetkov : [6. mednarodna znanstvena konferenca Slavistični znanstveni premisleki : 18. 5.-19. 5. 2023, Maribor, Slovenija]. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2023. 1 spletni vir (1 datoteka PDF (IV, 136 str.). ISBN 978-961-286-735-5. https://press.um.si/index.php/ump/catalog/book/774, https://dk.um.si/IzpisGradiva.php?id=84288, http://www.dlib.si/details/URN:NBN:SI:DOC-SG85YGU5, DOI: 10.18690/um.ff.5.2023. [COBISS.SI-ID 150988291]
LÜCKING, Andy (urednik), MAZZOCCONI, Chiara (urednik), VERDONIK, Darinka (urednik). SemDial 2023 : MariLogue : proceedings of the 27th Workshop on the Semantics and Pragmatics of Dialogue : held at University of Maribor, Faculty of Electrical Engineering and Computer Science, the Internet, August 16–17 2023. Maribor: University of Maribor, Faculty of Electrical Engineering and Computer Science, 2023. 1 spletni vir (1 datoteka PDF (VIII, 180 str.)), ilustr. Proceedings (SemDial). ISSN 2308-2275. https://mezzanine.um.si/wp-content/uploads/Marilogue_Proceedings1.pdf. [COBISS.SI-ID 167897859]
Tehnične smernice
VERDONIK, Darinka. Označevanje netekočnosti v govoru: primer označevanja z uporabo orodja Exmaralda. Maribor: Univerza, Fakulteta za elektrotehniko, računalništvo in informatiko, 2024. 24 str., pril. https://mezzanine.um.si/rezultati/, https://dk.um.si/IzpisGradiva.php?id=87952. [COBISS.SI-ID 191164931]
VERDONIK, Darinka, GOSTENČNIK, Januška. Smernice za zbiranje podatkov za govorne vire. Maribor: Univerza, Fakulteta za elektrotehniko, računalništvo in informatiko, 2024. 31 str. https://mezzanine.um.si/rezultati/#tehni%C4%8Dne-smernice, Digitalna knjižnica Univerze v Mariboru – DKUM. [COBISS.SI-ID 191313155]
Korpusi in podatkovne zbirke
V projektu MEZZANINE smo pomagali nadgraditi naslednje jezikovne vire:
VERDONIK, Darinka, ZWITTER VITEZ, Ana, ZEMLJARIČ MIKLAVČIČ, Jana, KREK, Simon, STABEJ, Marko, ERJAVEC, Tomaž, POTOČNIK, Tomaž, SEPESY MAUČEC, Mirjam, MAJHENIČ, Simona, ŽGANK, Andrej, BIZJAK, Andreja, GRIL, Lucija, DOBRIŠEK, Simon, KRIŽAJ, Janez, BAJEC, Marko, LEBAR BAJEC, Iztok, ŠOLTES, Tjaša, TROJAR, Mitja, BERNJAK, Mitja, DRETNIK, Naum, STRLE, Gregor, DOBROVOLJC, Kaja, LJUBEŠIĆ, Nikola, RUPNIK, Peter, et al. Spoken corpus Gos 2.1 (transcriptions). Ljubljana: Centre for Language Resources and Technologies, University of Ljubljana … [etc.]: IICT-BAS, 2023. CLARIN.SI data & tools. ISSN 2820-4042. http://hdl.handle.net/11356/1863. [COBISS.SI-ID 177487107]
KUZMAN, Taja, LJUBEŠIĆ, Nikola, ERJAVEC, Tomaž, FIŠER, Darja, MEDEN, Katja, PANČUR, Andrej, OJSTERŠEK, Mihael, RUPNIK, Peter, KRYVENKO, Anna, SKUBIC, Jure, et al. Linguistically annotated multilingual comparable corpora of parliamentary debates in English ParlaMint-en.ana 4.0. Ljubljana: Institut Jožef Stefan, 2023. CLARIN.SI data & tools. ISSN 2820-4042. http://hdl.handle.net/11356/1864. [COBISS.SI-ID 173570307]
TERČON, Luka, LJUBEŠIĆ, Nikola, ERJAVEC, Tomaž. Word embeddings CLARIN.SI-embed.sl 2.0. Ljubljana: Institut Jožef Stefan, 2023. CLARIN.SI data & tools. ISSN 2820-4042. http://hdl.handle.net/11356/1791. [COBISS.SI-ID 161108739]