Skoči do osrednje vsebine

Slovenska znanstvena besedila: viri in opis

Splošne informacije

Šifra: J6-7094
Obdobje: 1.1.2016 - 31.12.2018
Letni obseg: 0,94 FTE | 2016
Vodja projekta na FDV: izr.prof.dr. Nataša Logar
Veda: Humanistične vede

Vsebinski opis projekta

Razvoj in uporaba slovenskega znanstvenega jezika v visokem šolstvu ter znanosti je zadnja leta eno osrednjih vprašanj slovenske jezikovne politike. Problem je izpostavljen tudi v Resoluciji o Nacionalnem programu za jezikovno politiko 2014–2018, na vpliv, ki ga imata znanje in razvoj znanstvenega jezika na vitalnost posameznega jezika, pa opozarja tudi več evropskih študij. Zaradi tega je nujno izdelati sodobne referenčne jezikovne vire, ki bodo pomagali opolnomočiti slovenski znanstveni jezik, in na njih izvesti celovite raziskave tega segmenta slovenščine.   V zadnjem času so slovenske univerze začele vzpostavljati repozitorije svojih publikacij, ki vsebujejo raznorodna besedila, od doktorskih del do znanstvenih in strokovnih prispevkov. Pomemben mejnik je leta 2013 vzpostavljeni Nacionalni portal odprte znanosti, ki agregira vsebine iz repozitorijev slovenskih univerz. Portal že ponuja dostop do prek 123.000 slovenskih objav s širokega nabora strokovnih področij. Ta dela so izjemno dragocen, a zaenkrat še popolnoma neizkoriščen vir podatkov o znanstveni slovenščini, kot tudi bogat vir terminoloških podatkov.   Cilj projekta je preseči omenjene pomanjkljivosti ter omejitve, in to z več vidikov. V projektu bomo izdelali obsežen korpus slovenske znanstvene slovenščine, ki bo vseboval besedila, prevzeta s portala odprte znanosti. Besedila bodo zajeta iz izvornega formata (večinoma PDF), kar bo zahtevalo razvoj metod za čiščenje besedil, luščenje strukture dokumentov ter pretvorbo v enovit in standardiziran zapis XML. Korpus bo jezikoslovno označen z na novo razvitimi orodji, ki bodo še izboljšala kakovost označevanja jezikovnih virov slovenščine. Razvili bomo tudi metode za klasifikacijo besedil in luščenje ključnih besednih zvez, ki bodo izboljšale uporabnost portala odprte znanosti s tem, da bo z njimi omogočeno bolj kompleksno iskanje po vsebinah, s priporočili ključnih besednih zvez pa bo nadgrajen tudi vmesnik za knjižničarje, ki v univerzitetne repozitorije vnašajo nova besedila.   Korpus bo služil kot osnova za nove metode avtomatiziranega luščenja slovenske terminologije. Izluščeni terminološki kandidati bodo objavljeni prek prosto dostopnega spletnega slovarskega vmesnika, ki bo omogočal tako pregledovanje kot urejanje zbirk, kar bo slovenskim znanstvenim skupnostim z najrazličnejših področij omogočilo vključitev v upravljanje s terminologijo svojega področja. S strani treh izmed teh skupnosti bomo pridobili tudi odziv na terminološko zbirko, ki jo bomo zanje pripravili v projektu. Pomemben segment projekta je tudi prva empirično zasnovana raziskava slovenskega znanstvenega jezika, ki bo temeljila na reprezentativnem korpusu. Opis znanstvene slovenščine bomo dopolnili z izvedbo anket in poglobljenih intervjujev, s katerimi bomo pridobili podatke o tistih delih znanstvenega pisanja v slovenščini, s katerimi imajo pisci (zlasti doktorski študenti in mlajši doktorji znanosti) največ težav. Na podlagi ugotovitev bomo pripravili priročnik za dobro znanstveno pisanje v slovenščini.   Rezultati projekta bodo dostopni v največji možni meri: izdelani viri in orodja bodo prosto in javno dostopni širši raziskovalni skupnosti, s čimer bodo pripomogli k napredku korpusnega jezikoslovja, digitalne humanistike in jezikovnih tehnologij za slovenščino. Viri bodo arhivirani v repozitoriju raziskovalne infrastrukture CLARIN.SI, ki bo prevzela tudi vzdrževanje korpusa po zaključku projekta. Projekt bo v svoje aktivnosti prek dveh delavnic in konference vpel tudi širšo slovensko znanstveno skupnost in druge zainteresirane javnosti. Pri projektu bo sodelovalo deset raziskovalcev s štirih znanstvenoraziskovalnih ustanov, ki si bodo za uresničitev zastavljenih ciljev prizadevali z različnimi, a komplementarnimi znanji. Cilji, ki jih bomo v projektu dosegli, so: okrepitev slovenskega znanstvenega jezika, boljša opremljenost slovenskega jezika za delovanje v informacijski družbi in zagotavljanje večje odprtosti znanstvenih rezultatov.

Sodelujoče RO

http://www.sicris.si/public/jqm/prj.aspx?lang=slv&opt=2&subopt=403&hits=1&id=9966&search_term=J6-7094

Sestava projektne skupine

http://www.sicris.si/public/jqm/prj.aspx?lang=slv&opt=2&subopt=402&hits=1&id=9966&search_term=J6-7094

Bibliografske reference

http://www.sicris.si/public/jqm/prj.aspx?lang=slv&opt=2&subopt=400&hits=1&id=9966&search_term=J6-7094


Nazaj na seznam projektov