Results

The planned results of the project MEZZANINE include original scientific publications, technical reports/guidelines, applications, datasets and corpora.

Events

The 1st Internal MEZZANINE Workshop

Venue & date: ZRC SAZU, Ljubljana, April 14th, 2023, 9:00 AM till 1:00 PM

Participants: Project MEZZANINE researchers

Contents: The Slovenian Linguistic Atlas as a data source of the locational distribution displaying the Slovenian non-standard phones, novelties of the chapter Glasoslovni oris v Pravopisu 8.0. (An outline of Phonetics in Orthography 8.0), Prosody analyses in Praat, Sloleks and spoken Slovenian, Automatic speech recognition, Annotation of spoken language resources.

The 6th International Scientific Conference Slavic Scientific Considerations: Infrastructure for Spoken Language Research in Humanities and Language Technologies

Venue & date: Faculty of Arts, University of Maribor, May 18th-19th, 2023

Participants: Invited lecturers Mojca Smolej, Vesna Mikolič, Radovan Garabik, Peter Jurgec, project MEZZANINE researchers, and other researchers of the Slovenian and South Slavic languages

Content: See the book of abstracts (https://mezzanine.um.si/konference/6-mednarodna-znanstvena-konferenca-slavisticni-znanstveni-premisleki/#zbornik)

SemDial – MariLogue, The 27th Workshop on the Semantics and Pragmatics of Dialogue

Venue & date: Faculty of Electrical Engineering and Computer Science, University of Maribor, August 16th-17th, 2023

Participants: Researchers in the semantics and pragmatics of dialogue from everywhere

Content: See the book of abstracts (https://mezzanine.um.si/en/conference/semdial-2023-marilogue/#proceedings)

The 2nd Internal MEZZANINE Workshop

Venue & date: Faculty of Computer and Information Science, University of Ljubljana, September 9th, 9:30 AM till 2:00 PM

Participants: Project MEZZANINE researchers

Content: Spoken language resources Artur, Gos 2.0, and the spoken Slovene training corpus; lemmatization and annotation of MSD in spoken language resources; segmentation of spoken language into basic units; syntactic annotations of spoken language; phoneme and word segmentation processes for prosodic analysis

The 3rd Internal MEZZANINE Workshop

Venue & date: Faculty of Computer and Information Science, University of Ljubljana, February 13th, 9:00 AM till 2:00 PM

Participants: Project MEZZANINE researchers

Content: disfluency annotation in the corpus Iriss with the tool Exmaralda; using automatic segmentation tools, speaker recognition, and speech recognition tools for semi-automatic speech transcription; ParlaSpeech; corpus tags for the description of speech event context; the phonetic module of the geolinguistic application DIAtlas; the automatic segmentation of the corpus Gos 2.1 and the use of machine acoustic measurements

Expert panel ‘Frontiers in Speech Communication Research’

The event took place at the Language Technologies and Digital Humanities 2024 conference on September 19 at the Faculty of Electrical Engineering in Ljubljana. Recording and more information (https://www.sdjt.si/wp/jtdh-2024-en/#panels)

The 4th Internal MEZZANINE Workshop

Venue & date: Jožef Stefan Institute, October 22nd 2024, 9:30 AM till 13:30 PM

Participants: Project MEZZANINE researchers

Content: training corpus ROG – presentation of different levels of manual annotation; automatic detection of filled pauses, digital lexical database

Original scientific publications

1.01 Original scientific article

VERDONIK, Darinka. Primarne kategorije dialoških dejanj. Slavistična revija : časopis za jezikoslovje in literarne vede. [Tiskana izd.]. 2023, letn. 71, št. 1, str. 43-60. ISSN 0350-6894. https://srl.si/ojs/srl/article/view/4062, DOI: 10.57589/srl.v71i1.4062. [COBISS.SI-ID 151811075], [SNIP, Scopus]

SEPESY MAUČEC, Mirjam, VERDONIK, Darinka, DONAJ, Gregor. Sequence-to-Sequence models and their evaluation for spoken language normalization of Slovenian. Applied sciences. Oct. 2024, vol. 14, iss. 20, [article no.] 9515, 24 str. ISSN 2076-3417. DOI: 10.3390/app14209515. [COBISS.SI-ID 213048067], [JCRSNIPWoSScopus]

BIZJAK, Andreja. Korpusne oznake za opis konteksta govornih dogodkov v slovenskih govornih korpusih. Slovenščina 2.0 : empirične, aplikativne in interdisciplinarne raziskave. 2024, letn. 12, št. 1, str. 54-94, ilustr. ISSN 2335-2736. https://journals.uni-lj.si/slovenscina2/article/view/18015/16273, Digitalna knjižnica Univerze v Mariboru – DKUM, dCOBISS, DOI: 10.4312/slo2.0.2024.1.54-94. [COBISS.SI-ID 206755331], [Odprti dostop, SNIP, Scopus]

VERDONIK, Darinka, BIZJAK, Andreja, ŽGANK, Andrej, SEPESY MAUČEC, Mirjam, TROJAR, Mitja, ŽGANEC GROS, Jerneja, BAJEC, Marko, LEBAR BAJEC, Iztok, DOBRIŠEK, Simon. Strategies for managing time and costs in speech corpus creation : insights from the Slovenian ARTUR corpus. Language resources and evaluation. [Online ed.]. Published: 30 November 2024, 26 str., ilustr. ISSN 1574-0218. https://link.springer.com/article/10.1007/s10579-024-09746-8#article-info, DOI: 10.1007/s10579-024-09792-2. [COBISS.SI-ID 217959427]

1.04 Professional article

TERČON, Luka, LJUBEŠIĆ, Nikola. CLASSLA-Stanza : the next step for linguistic processing of South Slavic languages. ArXiv.org. [in press] 2023, eprint 2308.04255. ISSN 2331-8422. https://arxiv.org/abs/2308.04255, DOI: 10.48550/arXiv.2308.04255. [COBISS.SI-ID 187571459]

1.08 Published scientific conference contribution

VERDONIK, Darinka, BIZJAK, Andreja, ŽGANK, Andrej, DOBRIŠEK, Simon. Metapodatki o posnetkih in govorcih v govornih virih: primer baze Artur. V: FIŠER, Darja (ur.), ERJAVEC, Tomaž (ur.). Jezikovne tehnologije in digitalna humanistika : zbornik konference : 15.-16. september 2022, Ljubljana, Slovenija = Proceedings of the Conference on Language Technologies and Digital Humanities : September 15th-16th 2022, Ljubljana, Slovenia. 1st ed. Ljubljana: Inštitut za novejšo zgodovino: = Institute of Contemporary History, 2022. Str. 205-212. ISBN 978-961-7104-20-2. https://nl.ijs.si/jtdh22/pdf/JTDH2022_Proceedings.pdf. [COBISS.SI-ID 124488451]

AEPLI, Noëmi, ÇÖLTEKIN, Çagrı, LJUBEŠIĆ, Nikola, ZAMPIERI, Marcos, et al. Findings of the VarDial Evaluation Campaign 2023. V: SCHERRER, Yves (ur.), et al. The Tenth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial 2023) : proceedings of the workshop : [Dubrovnik], May 5, 2023. Stroudsburg: Association for Computational Linguistics, cop. 2023. Str. 251-261, tabele. ISBN 978-1-959429-50-0. https://aclanthology.org/2023.vardial-1.25.pdf, DOI: 10.18653/v1/2023.vardial-1.25. [COBISS.SI-ID 173399299]

KUZMAN, Taja, RUPNIK, Peter, LJUBEŠIĆ, Nikola. Get to know your parallel data : performing English variety and genre classification over MaCoCu Corpora. V: SCHERRER, Yves (ur.), et al. The Tenth Workshop on NLP for Similar Languages, Varieties and Dialects (VarDial 2023) : proceedings of the workshop : [Dubrovnik], May 5, 2023. Stroudsburg: Association for Computational Linguistics, cop. 2023. Str. 91-103, ilustr. ISBN 978-1-959429-50-0. https://aclanthology.org/2023.vardial-1.9.pdf, DOI: 10.18653/v1/2023.vardial-1.9. [COBISS.SI-ID 173393411]

OGRODNICZUK, Maciej, OSENOVA, Petja, ERJAVEC, Tomaž, FIŠER, Darja, LJUBEŠIĆ, Nikola, ÇÖLTEKIN, Çagrı, KOPP, Matyáš, MEDEN, Katja, KUZMAN, Taja. The ParlaMint Project : ever-growing family of comparable and interoperable parliamentary corpora. V: LINDÉN, Krister (ur.), NIEMI, Jyrki (ur.), KONTINO, Thalassia (ur.). CLARIN annual conference proceedings 2023 : 16 – 18 October 2023 Leuven, Belgium. [S. l.: s. n.], 2023. Str. 62-66, ilustr. CLARIN Annual Conference Proceedings. ISSN 2773-2177. https://office.clarin.eu/v/CE-2023-2328_CLARIN2023_ConferenceProceedings.pdf. [COBISS.SI-ID 169470211]

BAJEC, Marko, LEBAR BAJEC, Iztok, ŠOLTES, Tjaša, CVEK, Jernej, ČIBEJ, Jaka, GANTAR, Kaja, SEVER, Sara, KREK, Simon. Online Notes – a real-time speech recognition and machine translation system for Slovene university lectures. V: DEBEVC, Matjaž (ur.), KOŽUH, Ines (ur.). Digitalna vključenost v informacijski družbi = Digital Inclusion in Information Society : Informacijska družba – IS 2023 = Information Society – IS 2023 : zbornik 26. mednarodne multikonference = proceedings of the 26th International Multiconference : zvezek H = volume H : 11. oktober 2023, 11 October 2023, Ljubljana, Slovenia. Ljubljana: Institut “Jožef Stefan”, 2023. Str. 7-10, ilustr. Informacijska družba. ISBN 978-961-264-280-8. ISSN 2630-371X. https://is.ijs.si/wp-content/uploads/2023/11/IS2023_Volume-H.pdf. [COBISS.SI-ID 172807683]

ŠOLTES, Tjaša, BAJEC, Marko, LEBAR BAJEC, Iztok, GANTAR, Kaja, ŽITNIK, Slavko. Online-notes system : real-time speech recognition and translation of lectures. V: NURCAN, Selmin (ur.). Research challenges in information science : information science and the connected world : 17th International Conference, RCIS 2023, Corfu, Greece, May 23–26, 2023 : proceedings. Cham: Springer, cop. 2023. Str. 485-492, ilustr. Lecture notes in business information processing (Internet), 476. ISBN 978-3-031-33080-3. ISSN 1865-1356. https://link.springer.com/chapter/10.1007/978-3-031-33080-3_29, DOI: 10.1007/978-3-031-33080-3_29. [COBISS.SI-ID 157601539], [SNIP, Scopus]

SEPESY MAUČEC, Mirjam, VERDONIK, Darinka, DONAJ, Gregor. Analiza napak pretvornika pogovornega zapisa govora v standardizirani zapis. V: ŽEMVA, Andrej (ur.), TROST, Andrej (ur.). Zbornik triintridesete mednarodne Elektrotehniške in računalniške konference ERK 2024 = Proceedings of the 33rd International Electrotechnical and Computer Science Conference ERK 2024 : Portorož, Slovenija, 26. – 27. september 2024. Ljubljana: Slovenska sekcija IEEE: Fakulteta za elektrotehniko, 2024. Str. 526-529, ilustr. Zbornik … Elektrotehniške in računalniške konference (Online), 33. ISSN 2591-0442. https://erk.fe.uni-lj.si/2024. [COBISS.SI-ID 210645251]

VERDONIK, Darinka, DOBROVOLJC, Kaja, ERJAVEC, Tomaž, LJUBEŠIĆ, Nikola. Gos 2 : a new reference corpus of spoken Slovenian. V: CALZOLARI, Nicoletta (ur.). The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024) : main conference proceedings : 20-25 May, 2024, Torino, Italia. [Paris]: ELRA Language Resources Association (ELRA); [Stroudsburg]: International Committee on Computational Linguistics, cop. 2024. Str. 7825-7830, ilustr. International conference on computational linguistics, LREC proceedings. ISBN 978-2-493814-10-4. ISSN 2951-2093, ISSN 2522-2686. https://aclanthology.org/2024.lrec-main.691/. [COBISS.SI-ID 196938499]

KRIŽAJ, Janez, ŽGANEC GROS, Jerneja, DOBRIŠEK, Simon. Utilizing forced alignment for phonetic analysis of Slovene speech : Janez Križaj, Jerneja Žganec Gros, Simon Dobrišek. V: ARHAR HOLDT, Špela (ur.), ERJAVEC, Tomaž (ur.). Jezikovne tehnologije in digitalna humanistika : zbornik konference : 19.-20. september 2024, Ljubljana, Slovenija = Language technologies and digital humanities : proceedings of the conference : 19-20 September 2024, Ljubljana, Slovenia. 1. izd. Ljubljana: Inštitut za novejšo zgodovino: = Institute of Contemporary History, 2024. Str. 557-566, ilustr. ISBN 978-961-7104-40-0. https://zenodo.org/records/13912515https://www.sdjt.si/wp/wp-content/uploads/2024/09/JT-DH_2024_Krizaj_Gros_Dobrisek.pdfRepozitorij Univerze v Ljubljani – RUL. [COBISS.SI-ID 211915011], [Odprti dostop]

ČIBEJ, Jaka, MUNDA, Tina. Metoda polavtomatskega popravljanja lem in oblikoskladenjskih oznak na primeru učnega korpusa govorjene slovenščine ROG. V: ARHAR HOLDT, Špela (ur.), ERJAVEC, Tomaž (ur.). Jezikovne tehnologije in digitalna humanistika : zbornik konference : 19.-20. september 2024, Ljubljana, Slovenija = Language technologies and digital humanities : proceedings of the conference : 19-20 September 2024, Ljubljana, Slovenia. 1. izd. Ljubljana: Inštitut za novejšo zgodovino: = Institute of Contemporary History, 2024. Str. 66-86, ilustr. ISBN 978-961-7104-40-0. https://zenodo.org/records/13936390, DOI: 10.5281/zenodo.13936389. [COBISS.SI-ID 214863875], [Odprti dostop]

ČIBEJ, Jaka. Predicting pronunciation types in the Sloleks morphological lexicon of Slovene. V: MLADENIĆ, Dunja (ur.), GROBELNIK, Marko (ur.). Odkrivanje znanja in podatkovna skladišča – SiKDD = Data mining and data warehouses – SiKDD : Informacijska družba – IS 2024 = Information Society – IS 2024 : zbornik 27. mednarodne multikonference = proceedings of the 27th International Multiconference : zvezek C = volume C : 7. oktober 2024, 7 October 2024, Ljubljana, Slovenia. Ljubljana: Institut “Jožef Stefan”, 2024. Str. 23-26, tabele. Informacijska družba. ISBN 978-961-264-301-0. ISSN 2630-371X. https://is.ijs.si/wp-content/uploads/2024/11/IS2024_Volume-C.pdf, DOI: 10.70314/is.2024.sikdd.2. [COBISS.SI-ID 215529219]
kategorija: 4D (Z); tip dela je verificiral OSICH

VERDONIK, Darinka, LJUBEŠIĆ, Nikola, RUPNIK, Peter, DOBROVOLJC, Kaja, ČIBEJ, Jaka. Izbor in urejanje gradiv za učni korpus govorjene slovenščine ROG. V: ARHAR HOLDT, Špela (ur.), ERJAVEC, Tomaž (ur.). Jezikovne tehnologije in digitalna humanistika : zbornik konference : 19.-20. september 2024, Ljubljana, Slovenija = Language technologies and digital humanities : proceedings of the conference : 19-20 September 2024, Ljubljana, Slovenia. 1. izd. Ljubljana: Inštitut za novejšo zgodovino: = Institute of Contemporary History, 2024. Str. 469-484, tabele. ISBN 978-961-7104-40-0. https://zenodo.org/records/13936426, DOI: 10.5281/zenodo.13936425. [COBISS.SI-ID 216104963]

LJUBEŠIĆ, Nikola, GALANT, Nada, BENČINA, Sonja, ČIBEJ, Jaka, MILOSAVLJEVIĆ, Stefan, RUPNIK, Peter, KUZMAN, Taja. DIALECT-COPA : extending the standard translations of the COPA causal commonsense reasoning dataset to South Slavic dialects. V: SCHERRER, Yves (ur.). VarDial 2024 – The Eleventh Workshop on NLP for Similar Languages, Varieties and Dialects : proceedings of the workshop : [Mexico City, Mexico], June 20, 2024. Kerrville (TX): Association for Computational Linguistics, cop. 2024. Str. 89-98. ISBN 979-8-89176-104-9. https://aclanthology.org/2024.vardial-1.7.pdf. [COBISS.SI-ID 202856707]

1.12 Published scientific conference contribution abstract

KRAJNC IVIČ, Mira, ANTLOGA, Špela. Predlog izdelave korpusa humorja v govoru za slovenščino = Spoken Slovene corpus of humor : draft proposal. V: KRAJNC IVIČ, Mira (ur.). Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah : zbornik povzetkov : [6. mednarodna znanstvena konferenca Slavistični znanstveni premisleki : 18. 5.-19. 5. 2023, Maribor, Slovenija]. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2023. Str. 69-72. ISBN 978-961-286-735-5. https://press.um.si/index.php/ump/catalog/book/774. [COBISS.SI-ID 165263619]

ŠUMENJAK, Klara. Standardi transkribiranja narečnega korpusa GOKO = GOKO dialect corpus transcription standards. V: KRAJNC IVIČ, Mira (ur.). Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah : zbornik povzetkov : [6. mednarodna znanstvena konferenca Slavistični znanstveni premisleki : 18. 5.-19. 5. 2023, Maribor, Slovenija]. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2023. Str. 105-109. ISBN 978-961-286-735-5. https://press.um.si/index.php/ump/catalog/book/774. [COBISS.SI-ID 176452867]

VERDONIK, Darinka, TROJAR, Mitja, BIZJAK, Andreja. Prednosti in slabosti dvotirnega zapisovanja govora v slovenskih govornih virih = Advantages and Disadvantages of Two-level Speech Transcription in the Slovenian Speech Resources. V: KRAJNC IVIČ, Mira (ur.). Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah : zbornik povzetkov : [6. mednarodna znanstvena konferenca Slavistični znanstveni premisleki : 18. 5.-19. 5. 2023, Maribor, Slovenija]. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2023. Str. 111-114. ISBN 978-961-286-735-5. https://press.um.si/index.php/ump/catalog/book/774. [COBISS.SI-ID 158884355]

VERDONIK, Darinka, MAJHENIČ, Simona, BIZJAK, Andreja. Are metadiscourse dialogue acts a category on their own?. V: LÜCKING, Andy (ur.), MAZZOCCONI, Chiara (ur.), VERDONIK, Darinka (ur.). SemDial 2023 : MariLogue : proceedings of the 27th Workshop on the Semantics and Pragmatics of Dialogue : held at University of Maribor, Faculty of Electrical Engineering and Computer Science, the Internet, August 16–17 2023. Maribor: University of Maribor, Faculty of Electrical Engineering and Computer Science, 2023. Str. 178-180. Proceedings (SemDial). ISSN 2308-2275. https://mezzanine.um.si/wp-content/uploads/Marilogue_Proceedings1.pdf. [COBISS.SI-ID 173321219]

ČIBEJ, Jaka, ROBIDA, Nejc, KREK, Simon. Vključevanje nestandardnih vnosov v slovenske jezikovne vire z vidika jezikovnotehnoloških potreb = Inclusion of non-standard entries in Slovene language resources with regard to language technology needs. V: KRAJNC IVIČ, Mira (ur.). Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah : zbornik povzetkov. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2023. Str. 37-40. ISBN 978-961-286-735-5. https://press.um.si/index.php/ump/catalog/book/774. [COBISS.SI-ID 202210563]

1.16 Independent scientific component part or a chapter in a monograph

VERDONIK, Darinka. Zbiranje gradiv za govorne korpuse med Scilo in Karibdo. V: ARHAR HOLDT, Špela (ur.), KREK, Simon (ur.). Razvoj slovenščine v digitalnem okolju. 1. izd. Ljubljana: Založba Univerze, 2023. Str. 15-37, ilustr. Sporazumevanje. ISBN 978-961-297-256-1. ISSN 2738-4527. https://ebooks.uni-lj.si/ZalozbaUL/catalog/view/522/852/9447. [COBISS.SI-ID 185550083]

VERDONIK, Darinka, TROJAR, Mitja, BIZJAK, Andreja. Prednosti in slabosti dvotirnega zapisovanja govora v slovenskih govornih virih. V: KRAJNC IVIČ, Mira (ur.). Stanje in perspektive uporabe govornih virov v raziskavah govora. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2024. Str. 63-79, ilustr. ISBN 978-961-286-882-6. https://press.um.si/index.php/ump/catalog/book/898/chapter/48, DOI: 10.18690/um.ff.4.2024.4. [COBISS.SI-ID 202752259]

ČIBEJ, Jaka, ROBIDA, Nejc, KREK, Simon. Nadgradnja Digitalne slovarske baze za slovenščino in Slovenskega oblikoslovnega leksikona Sloleks s podatki o govorjeni slovenščini : načrti in cilji. V: KRAJNC IVIČ, Mira (ur.). Stanje in perspektive uporabe govornih virov v raziskavah govora. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2024. Str. 27-39. ISBN 978-961-286-882-6. https://press.um.si/index.php/ump/catalog/book/898/chapter/46, DOI: 10.18690/um.ff.4.2024.2. [COBISS.SI-ID 203079683]

ROBIDA, Nejc, ČIBEJ, Jaka, KREK, Simon. Strojni razrez posnetkov iz korpusa govorjene slovenščine GOS 2.1 in fonetične meritve. V: ŠTUMBERGER, Saška (ur.). Predpis in norma v jeziku. 1. natis. Ljubljana: Založba Univerze, 2024. Str. 267-274, ilustr. Zbirka Obdobja, 43. ISBN 978-961-297-439-8. ISSN 1408-211X. https://centerslo.si/wp-content/uploads/2024/11/Robida-et-al._Obdobja-43.pdf, DOI: 10.4312/Obdobja.43.267-274. [COBISS.SI-ID 215451395], [Odprti dostop]

Professional publications and secondary authorship

1.09 Published professional conference contribution

8. MAJHENIČ, Simona. No, tudi z diskurznimi označevalci lahko tolmači veliko povemo : Pomen tolmačenja diskurznih označevalcev. V: ZIDAR FORTE, Jana (ur.). Odvrženi plašč nevidnosti : jubilejni zbornik ob 50-letnici ZKTS. Ljubljana: Združenje konferenčnih tolmačev Slovenije, 2023. Str. 69-75. ISBN 978-961-96113-0-2. http://zkts.si/images/Zbornik_ZKTS50.pdf. [COBISS.SI-ID 138132483]
financer: ARRS, Projekt, J7-4642, SI, MEZZANINE – teMeljnE raZiskave Za rAzvoj govorNih vIrov in tehNologij za slovEnščino

1.20 Preface, editorial, afterword

9. KRAJNC IVIČ, Mira. Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah : zbornik povzetkov = Infrastructure for speech research in the humanities and language technologies : book of abstracts. V: KRAJNC IVIČ, Mira (ur.). Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah : zbornik povzetkov : [6. mednarodna znanstvena konferenca Slavistični znanstveni premisleki : 18. 5.-19. 5. 2023, Maribor, Slovenija]. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2023. Str. 137-138. ISBN 978-961-286-735-5. https://press.um.si/index.php/ump/catalog/book/774. [COBISS.SI-ID 165772035]

3.15 Unpublished conference contribution

29. MAJHENIČ, Simona. Cognitive discourse markers in simultaneous interpreting : predavanje na konferenco na Université Paris Cité z naslovom “Discourse Markers – Theories and Methods”, Pariz, Francija, 25. 5. 2023. [COBISS.SI-ID 174052355]
financer: ARRS, Projekt, J7-4642, SI, MEZZANINE – teMeljnE raZiskave Za rAzvoj govorNih vIrov in tehNologij za slovEnščino

Editor

KRAJNC IVIČ, Mira (urednik). Infrastruktura za raziskave govora v humanistiki in jezikovnih tehnologijah : zbornik povzetkov : [6. mednarodna znanstvena konferenca Slavistični znanstveni premisleki : 18. 5.-19. 5. 2023, Maribor, Slovenija]. 1. izd. Maribor: Univerza v Mariboru, Univerzitetna založba, 2023. 1 spletni vir (1 datoteka PDF (IV, 136 str.). ISBN 978-961-286-735-5. https://press.um.si/index.php/ump/catalog/book/774, https://dk.um.si/IzpisGradiva.php?id=84288, http://www.dlib.si/details/URN:NBN:SI:DOC-SG85YGU5, DOI: 10.18690/um.ff.5.2023. [COBISS.SI-ID 150988291]

LÜCKING, Andy (urednik), MAZZOCCONI, Chiara (urednik), VERDONIK, Darinka (urednik). SemDial 2023 : MariLogue : proceedings of the 27th Workshop on the Semantics and Pragmatics of Dialogue : held at University of Maribor, Faculty of Electrical Engineering and Computer Science, the Internet, August 16–17 2023. Maribor: University of Maribor, Faculty of Electrical Engineering and Computer Science, 2023. 1 spletni vir (1 datoteka PDF (VIII, 180 str.)), ilustr. Proceedings (SemDial). ISSN 2308-2275. https://mezzanine.um.si/wp-content/uploads/Marilogue_Proceedings1.pdf. [COBISS.SI-ID 167897859]

Studies

VERDONIK, Darinka. Označevanje netekočnosti v govoru: primer označevanja z uporabo orodja Exmaralda. Maribor: Univerza, Fakulteta za elektrotehniko, računalništvo in informatiko, 2024. 24 str., pril. https://mezzanine.um.si/rezultati/, https://dk.um.si/IzpisGradiva.php?id=87952. [COBISS.SI-ID 191164931]

VERDONIK, Darinka, GOSTENČNIK, Januška. Smernice za zbiranje podatkov za govorne vire. Maribor: Univerza, Fakulteta za elektrotehniko, računalništvo in informatiko, 2024. 31 str. https://mezzanine.um.si/rezultati/#tehni%C4%8Dne-smernice, Digitalna knjižnica Univerze v Mariboru – DKUM. [COBISS.SI-ID 191313155]

Corpora and research data

In the MEZZANINE project we have helped upgrading the following language resources:

VERDONIK, Darinka, ZWITTER VITEZ, Ana, ZEMLJARIČ MIKLAVČIČ, Jana, KREK, Simon, STABEJ, Marko, ERJAVEC, Tomaž, POTOČNIK, Tomaž, SEPESY MAUČEC, Mirjam, MAJHENIČ, Simona, ŽGANK, Andrej, BIZJAK, Andreja, GRIL, Lucija, DOBRIŠEK, Simon, KRIŽAJ, Janez, BAJEC, Marko, LEBAR BAJEC, Iztok, ŠOLTES, Tjaša, TROJAR, Mitja, BERNJAK, Mitja, DRETNIK, Naum, STRLE, Gregor, DOBROVOLJC, Kaja, LJUBEŠIĆ, Nikola, RUPNIK, Peter, et al. Spoken corpus Gos 2.1 (transcriptions). Ljubljana: Centre for Language Resources and Technologies, University of Ljubljana … [etc.]: IICT-BAS, 2023. CLARIN.SI data & tools. ISSN 2820-4042. http://hdl.handle.net/11356/1863. [COBISS.SI-ID 177487107]

KUZMAN, Taja, LJUBEŠIĆ, Nikola, ERJAVEC, Tomaž, FIŠER, Darja, MEDEN, Katja, PANČUR, Andrej, OJSTERŠEK, Mihael, RUPNIK, Peter, KRYVENKO, Anna, SKUBIC, Jure, et al. Linguistically annotated multilingual comparable corpora of parliamentary debates in English ParlaMint-en.ana 4.0. Ljubljana: Institut Jožef Stefan, 2023. CLARIN.SI data & tools. ISSN 2820-4042. http://hdl.handle.net/11356/1864. [COBISS.SI-ID 173570307]

TERČON, Luka, LJUBEŠIĆ, Nikola, ERJAVEC, Tomaž. Word embeddings CLARIN.SI-embed.sl 2.0. Ljubljana: Institut Jožef Stefan, 2023. CLARIN.SI data & tools. ISSN 2820-4042. http://hdl.handle.net/11356/1791. [COBISS.SI-ID 161108739]