Zbornik konference Jezikovne tehnologije in digitalna humanistika

Avtorji

Darja Fišer (ed)
Filozofska fakulteta, Univerza v Ljubljani; Institut Jožef Stefan
Andrej Pančur (ed)
Inštitut za novejšo zgodovino

Ključne besede:

jezikovne tehnologije, digitalna humanistika

Kratka vsebina

Z letošnjo konferenco obeležujemo 20 let od prve konference »Jezikovne tehnologije«, ki so jo 1998 v Cankarjevem domu v Ljubljani organizirali Tomaž Erjavec, Vojko Gorjanc, Jerneja Žganec Gros in Anica Rant. Takratna konferenca je bila posvečena uporabi in razvoju jezikovnih tehnologij za slovenščino, možnostim njihove uporabe in smernicam prihodnjega razvoja na tem področju. Na konferenci je bilo predstavljenih 26 prispevkov, ki so obravnavali govorne tehnologije in glasoslovje, uporabo računalnikov v prevajanju in poučevanju jezikov, računalniške korpuse, standarde zapis jezikovnih podatkov in iskanje informacij na internetu. Konferenci je sledila okrogla miza, katere neposredni rezultat je bil ustanovitev Slovenskega društva za jezikovne tehnologije, ki je bil nato glavni pobudnik in organizator vseh nadaljnjih edicij konference. Skupaj s Centrom za jezikovne vire in tehnologije Univerze v Ljubljani (CJVT), Fakulteto za elektrotehniko Univerze v Ljubljani ter raziskovalnima infrastrukturama CLARIN.SI in DARIAH-SI jo 20. 9. in 21. 9. 2018 na Fakulteti za elektrotehniko prireja tudi letos, že enajstič po vrsti, ki po predlanski uspešni programski širitvi na digitalno humanistiko ohranja povezovalni fokus med disciplinama, hkrati pa si prizadeva postati pomembno srečevališče raziskovalcev v regiji.

Na letošnji konferenci se tako predstavlja 47 prispevkov, od tega 2 prispevka vabljenih predavateljev, 36 rednih polnih prispevkov in 5 povzetkov ter 4 študentski prispevki. Vse redne in študentske prispevke so pregledali trije recenzenti. 21 prispevkov je napisanih v slovenskem, 26 pa v angleškem jeziku. Skupno število vseh avtorjev prispevkov je 92. Dobra polovica avtorjev prihaja iz Slovenije, iz sosednje Hrvaške 10 %, ostali avtorji pa iz kar 19 različnih držav. Zato smo program sestavili tako, da prvi dan konference poteka v angleškem jeziku, drugi dan pa v slovenščini. Za razliko od prejšnje konference letošnje sekcije niso paralelne, kar udeležencem omogoča spremljanje vseh predavanj in predstavitev. Za ta ukrep smo se odločili prav zaradi želje po še tesnejšem sodelovanju med raziskovalci s področja jezikoslovnih tehnologij in digitalne humanistike. Istočasno smo prvič uvedli predstavitev posterjev, na kateri se jih tokrat predstavlja 9.

Urednika se iz srca zahvaljujeva vsem, ki so prispevali k uspehu konference: vabljenim predavateljem, avtorjem prispevkov, programskemu odboru za predano in natančno recenzentsko delo, organizacijskemu odboru za izvedbo konference, vodjem sekcij, da so predavanja gladko potekala, tehničnim urednikom za pripravo spletnega zbornika in sponzorjem za izkazano podporo.

Poglavja

  • Uvodni del
  • Too good to be true
    Current approaches to author profiling
    Malvina Nissim
  • Bringing Digital Humanities to the wider public
    libraries as incubator for DH research results
    Martijn Kleppe
  • A Comparison of Statistical and Neural Machine Translation for Slovene, Serbian and Croatian
    Mihael Arčan
  • SETimes.SR – A Reference Training Corpus of Serbian
    Vuk Batanovi´ć, Nikola Ljubešić, Tanja Samardžić
  • Artistic Visualizations and Beyond
    A Study of Materializations of a Digital Database
    Narvika Bovcon, Aleš Vaupotič
  • Opus-MontenegrinSubs 1.0
    First electronic corpus of the Montenegrin language
    Nikola Ljubešić, Petar Božović, Tomaž Erjavec, Jörg Tiedemann, Vojko Gorjanc
  • Zapis in prikaz starejših pesniških besedil ter njihovih variant v TEI
    Tomaž Erjavec, Nina Ditmajer, Matija Ogrin
  • Zakaj ne z eno poizvedbo hkrati po različnih korpusih?
    Troje korpusnih preverb pod primerjalnim drobnogledom
    Helena Dobrovoljc, Urška Vranjek Ošlak
  • Frekvenčni seznami n-gramov v korpusih slovenskega jezika
    Kaja Dobrovoljc
  • Razvoj smernic za predajo in arhiviranje kvalitativnih podatkov v Arhivu družboslovnih podatkov
    Maja Dolinar, Janez Štebe, Sonja Bezjak
  • Prehod iz statističnega strojnega prevajanja na prevajanje z nevronskimi omrežji za jezikovni par slovenščina-angleščina
    Gregor Donaj, Mirjam Sepesy Maučec
  • Analiza tvitov slovenskih korporativnih uporabnikov
    Darja Fišer, Monika Kalin Golob
  • Citiranje jezikoslovnih podatkov v slovenskih znanstvenih objavah: stanje in priporočila
    Darja Fišer, Tomaž Erjavec, Jakob Lenardič
  • Glagolske večbesedne enote v učnem korpusu ssj500k 2.1
    Polona Gantar, Špela Arhar Holdt, Jaka Čibej, Taja Kuzman, Teja Kavčič
  • Towards Semantic Role Labeling in Slovene and Croatian
    Nikola Ljubešić, Polona Gantar, Kristina Štrkalj Despot, Simon Krek
  • Zbirka primerov rabe vejice Vejica 1.3
    Peter Holozan
  • Croatian Web Dictionary Mrežnik
    One year later - What is different?
    Lana Hudeček, Milica Mihaljević
  • Portuguese Corpora of the 18th century
    Old Medicine texts for teaching and research activities
    Maria José Bocorny Finatto, Paulo Quaresma, Maria Filomena Gonçalves
  • Interaktivna karta slovenskih narečnih besedil
    Alenka Kavčič, Ivan Lovrić, Vera Smole
  • Učinkovit izračun frekvenčnih statistik za slovenske jezikovne korpuse
    Simon Krek, Aleksander Ključevšek, Marko Robnik-Šikonja
  • Kolokacijski slovar sodobne slovenščine
    Aniko Kovač, Maja Marković
  • A Rule-Based Syllabifier for Serbian
    Aniko Kovač, Maja Marković
  • Debating Evil
    Using Word Embeddings to Analyze Parliamentary Debates on War Criminals in The Netherlands
    Milan M. van Lange, Ralf D. Futselaar
  • hr500k – A Reference Training Corpus of Croatian
    Vuk Batanovi´ć, Nikola Ljubešić, Tomaž Erjavec, Željko Agić, Filip Klubička
  • The Parlameter corpus of contemporary Slovene parliamentary proceedings
    Darja Fišer, Nikola Ljubešić, Tomaž Erjavec, Filip Dobranič
  • KAS-term and KAS-biterm
    Datasets and baselines for monolingual and bilingual terminology extraction from academic writing
    Darja Fišer, Nikola Ljubešić, Tomaž Erjavec
  • Strokovno-znanstvena slovenščina: besednovrstne in oblikoskladenjske značilnosti
    Tomaž Erjavec, Nataša Logar
  • Word Selection in the Slovenian Sentence Matrix Test for Speech Audiometry
    Tatjana Marvin, Jure Derganc, Samo Beguš, Saba Battelino
  • Korpusna analiza nestandardne stave vejice po uvajalnih prislovnih zvezah
    Darja Fišer, Vojko Gorjanc, Eneja Osrajnik
  • Trajnost digitalnih izdaj
    Uporaba statičnih spletnih strani na portalu Zgodovina Slovenije - SIstory
    Andrej Pančur
  • Spregledana kulturna dediščina in uporaba digitalne raziskovalne infrastrukture za humanistiko v raziskavi Odlivanje smrti
    Andrej Pančur, Alenka Pirman, Maruša Kocjančič
  • Analiza slovničnih napak v korpusu spisov učencev japonščine na osnovni ravni
    Miha Pavlovič, Rena Ito
  • Building a corpus of the Croatian parliamentary debates using UDPipe open source NLP tools and Neo4j graph database for creation of social ontology model, text classification and extraction of semantic information
    Benedikt Perak, Filip Rodik
  • Samopromocija na Instagramu
    Primer predsednikovega profila
    Dan Podjed, Ajda Pretnar
  • Data Mining Workspace Sensors
    A New Approach to Anthropology
    Dan Podjed, Ajda Pretnar
  • Crowdsourcing terminology: harnessing the potential of translator’s glossaries
    Ivanka Rajh, Siniša Runjaić
  • Evaluation of Statistical Readability Measures on Slovene texts
    Špela Arhar Holdt, Simon Krek, Marko Robnik-Šikonja, Tadej Škvorc, Senja Pollak
  • Exploring Finno-Ugric linguistics through solving IT problems
    Tobias Weber, Jeremy Bradley
  • Teaching women writers with NEWW Virtual Research Environment
    Narvika Bovcon, Katja Mihurko Poniž, Marie Nedregotten Sørbø, Viola Parente-Čapková, Amelia Sanz, Suzan van Dijk, Aleš Vaupotič
  • Odnosi do jezika v slovenski, hrvaški in srbski računalniško posredovani komunikaciji
    Darja Fišer, Damjan Popič
  • Online database in Research of Correspondence of Franjo Ksaver Kuhač (1834-1911)
    Sara Ries
  • Distant Reading for European Literary History. A COST Action
    Katja Mihurko Poniž, Christof Schöch, Maciej Eder, Carolin Odebrecht, Mike Kestemont, Antonija Primorac, Justin Tonra, Catherine Kanellopoulou
  • Korpus in baza Gos Videolectures
    Darinka Verdonik
  • Korpus tvitov slovenskih politikov Janes TwePo
    Urška Bratoš
  • You, thou and thee
    A statistical analysis of Shakespeare’s use of pronominal address terms
    Isolde van Dorst
  • Primerjava luščilnikov terminologije Sketch Engine in CollTerm za znanstvena besedila
    Klara Eva Kukovičič
  • K-means Clustering for POS Tagger Improvement
    Gabi Rolih

Downloads

Download data is not yet available.

Prenosi

Izdano

2 July 2018

Podrobnosti o monografski publikaciji

ISBN-13 (15)

978-961-06-0111-1

Date of first publication (11)

2018-10-01

Kako citirati

Fišer, D., & Pančur, A. (Eds.). (2018). Zbornik konference Jezikovne tehnologije in digitalna humanistika. Založba Univerze v Ljubljani. https://doi.org/10.4312/9789610601111