Skoči do osrednje vsebine

TAP J5-2557 Evaluacija bločnega modeliranja časovnih omrežij

Šifra:

J5-2557

Obdobje:

1.9.2020 - 31.8.2023

Letni obseg:

1,60 FTE | 2021

Vodja projekta na FDV:

prof.dr. Aleš Žiberna

Veda:

Družboslovje

Faze projekta in njihova realizacija:

Izvedba projekta bo organizirana v tako imenovanih delovnih paketih (DP), ki sledijo ciljem raziskovalnega projekta. Delo na projektu in posamezne projektne naloge bodo organizirane, kot sledi: DP1 – Pripravljalna faza a. Pregled literature b. Ocena metod za bločno modeliranje časovnih omrežij in iskanje pripadajočih programskih implementacij, primernih za Monte Carlo simulacijske študije c. Ocena metod za generiranje slučajnih omrežij, ki jih je mogoče uporabiti oziroma prilagoditi za generiranje časovnih omrežij, za uporabo v Monte Carlo simulacijskih študijah DP2 – Razvoj algoritmov za generiranje slučajnih časovnih omrežij z znanim bločnim modelom in razvrstitvijo v vsaki časovni točki a. Poglobljena študija obstoječih pristopov b. Načrtovanje potrebnih prilagoditev obstoječih pristopov ali razvoj popolnoma novih pristopov za generiranje slučajnih časovnih omrežij c. Programska implementacija razvitih pristopov za programski jezik R d. Evalvacija algoritmov v smislu zmožnosti generiranja omrežij s podobnimi lastnostmi, kot veljajo za realna socialna omrežja e. Razvoj knjižnice (paketka) z implementiranimi pristopi za programski jezik R DP3 – Evalvacija algoritmov za bločno modeliranje časovnih omrežij z Monte Carlo simulacijami a. Prilagoditev obstoječih implementacij algoritmov za simulacije. b. Priprava načrta za izvedbo simulacij c. Analiza rezultatov simulacij d. Priprava priporočil na podlagi rezultatov simulacij DP4 – Uporaba izbranega pristopa za bločno modeliranje dinamike soavtorskih omrežij slovenskih raziskovalcev a. Pregled literature s področja znanstvenega sodelovanja. b. Operacionalizacija znanstvenega sodelovanja. c. Priprava podatkov. d. Preliminarne analize. e. Analize z izbranim pristopom bločnega modeliranja. f. Priprava poročil DP5 – Upravljanje projekta in diseminacija rezultatov a. Koordinacija projekta b. Diseminacija rezultatov c. Priprava poročil d. Priprava končnega poročila Spodaj sledi podrobnejši opis posameznih delovnih paketov oziroma skupin delovnih paketov. Prvi delovni paket (DP1) s pripravljalnimi opravili je pomemben za vse tri raziskovalne cilje. Glavni poudarek bo namenjen (i) zbiranju pristopov za bločno modeliranje časovnih omrežij (in morebitnih ustreznih programskih implementacij) in (ii) pregledu in oceni pristopov, ki bi jih bilo mogoče prilagoditi za generiranje časovnih omrežij z lastnostmi, kot je opisano v prejšnjih razdelkih. V okviru DP2 bodo preučeni različni obstoječi algoritmi za generiranje slučajnih omrežij z možnimi prilagoditvami za uporabo v simulacijskih študijah Monte Carlo. Po potrebi bodo predlagani tudi popolnoma novi pristopi. Spremenjeni in/ali predlagani algoritmi bodo implementirani v programski jezik R (R Core Team, 2008). Različni algoritmi za generiranje časovnih omrežij bodo evalvirani in primerjani v kontekstu zmožnosti generiranja časovnih omrežij, podobnih empiričnim socialnim omrežjem. DP3 se nanaša na osrednje raziskovalno vprašanje, ki ga naslavlja evalvacija in primerjava različnih pristopov za bločno modeliranje časovnih omrežij. Odvisno od programskih implementacij izbranih (v okviru DP1) pristopov bločnega modeliranja, bodo obstoječe programske implementacije prilagojene ali pa bodo dodane potrebne povezovalne komponente. Slednje je potrebno za zagotovitev zmožnosti uporabe pristopov v simulacijah Monte Carlo (na primer, zmožnost avtomatizirane uporabe obstoječih pristopov, skladnost formata vhodnih in izhodnih podatkov, …) ter za zagotovitev ustrezne ravni nepristranskosti primerjav različnih pristopov bločnega modeliranja. Vzporedno z omenjenimi opravili bo narejena zasnova za simulacije, v okviru katere bodo izbrani tudi preučevani dejavniki. Primeri takšnih dejavnikov so velikost omrežja (število enot), število časovnih točk, stabilnost omrežja, razvrstitev in povezav med skupinami ter gostota omrežja. Na podlagi rezultatov simualcij Monte Carlo bodo pripravljena priporočila za uporabo analiziranih pristopov za bločno modeliranje. Empirični podatki o znanstvenem sodelovanju bodo analizirani z uporabo enega ali več pristopov za bločno modeliranje. V okviru DP4 bodo tako zbrani in ustrezno pripravljeni podatkov o soavtorstvih, posebna pozornost pa bo namenjena različnim operacionalizacijam znanstvenega sodelovanja. V zvezi s tem bo preučevan (i) vpliv upoštevanja različnih vrst znanstvenih publikacij kot operacionalizacije znanstvenega sodelovanja na rešitev bločnega modeliranja ter (ii) vpliv različnih načinov binarizacije tovrstnih omrežij oziroma analizi uteženih omrežij. Navedeno je zelo pomembno, saj znotraj različnih znanstvenih disciplin obstajajo različne kulture objavljanja znanstvenih rezultatov, glede na vrsto znanstvenih objav (na primer, znanstven članek, knjiga), pa tudi glede navajanja števila soavtorjev (Kronegger idr., 2015). Analiza bo opravljena vsaj na ravni znanstvenih disciplin za čas po letu 1990. Rezultati bločnega modeliranja bodo primerjani z rezultati Cugmas et al. (2016). DP4 je močno povezan s predhodnimi delovnimi paketi (DP2 in DP3): na podlagi rezultatov evalvacije različnih pristopov bločnega modeliranja iz DP3 bo izbran najprimernejši pristop za bločno modeliranje soavtorskih omrežij, med tem ko bodo preliminarni rezultati DP4 uporabljeni, da bodo rezultati DP2 in DP3 bolj relevantni za soavtorska omrežja. Zadnji delovni paket (DP5) zajema splošno upravljanje projekta , ki se bo izvajalo skozi celotno trajanje projekta. Služi kot podpora vsem drugim delovnim paketom, zlasti v smislu koordiancije in diseminacije znanstvenih spoznanj. To bo izvedeno z (i) objavami v mednarodnih revijah; (ii) z aktivnim sodelovanjem na konferencah s področja analize socialnih omrežij, statistike in sociologije; (iii) z objavljanjem odprtokodnih knjižnic z implementirano programsko opremo za programski jezik R; (iv) z obveščanjem splošne javnosti o rezultatih raziskav preko uradnih kanalov družbenih omrežij (npr. Twitter, Facebook, LinkedIn). Znotraj tega delovnega paketa bodo pripravljena tudi zahtevana sprotna poročila in končno raziskovalno poročilo.

Sodelujoče RO:

https://cris.cobiss.net/ecris/si/sl/project/18320

Sestava projektne skupine:

https://cris.cobiss.net/ecris/si/sl/project/18320

Bibliografske reference:

https://bib.cobiss.net/biblioweb/eval/si/slv/evalprj/18320

Vsebinski opis projekta:

OZADJE: Analiza omrežij predstavlja osrednji pristop za analizo družbenih interakcij. Omrežje je definirano z množico vozlišč (ki predstavljajo enote) in z množico povezav, ki predstavljajo odnose med enotami. Znotraj analize omrežij se vse več pozornosti namenja analizi časovnih omrežij. V prijavi raziskovalnega projekta se izraz »časovno omrežje« nanaša na množico omrežij, ki so opazovana na isti množici vozlišč (dovoljena so tudi nova vozlišča in osip), opazovanih v več zaporednih časovnih točkah. Bločno modeliranje je pristop za razvrščanje enot v omrežju (na podlagi strukture povezav) in za določitev povezav med dobljenimi skupinami in se torej lahko uporablja za opis globalne strukture proučevanega omrežja. Poleg redukcije podatkov se bločno modeliranje uporablja tudi kot pristop za operacionalizacijo družbenih vlog. Ker je bila večina pristopov za bločno modeliranje časovnih omrežij razvita v preteklem desetletju, raziskovalci še vedno pogosto ločeno analizirajo omrežja iz različnih časovnih točk. Tak pristop je pomanjkljiv, saj predpostavlja, da so omrežja iz različnih časovnih točk med sabo neodvisna. Tovrstno odvisnost je mogoče upoštevati z uporabo pristopov za bločno modeliranje časovnih omrežij, kar omogoča bolj veljavne rezultate, bolj "gladke" spremembe v času in posledično olajša proučevanje sprememb v času. OPREDELITEV PROBLEMA: Različni pristopi za bločno modeliranje časovnih omrežij še niso bili sistematično evalvirani in preučevani z uporabo simulacij Monte Carlo. Evalvacija je potrebna za razvoj priporočil za izbiro in uporabo ustreznih pristopov bločnega modeliranja. Pogoj za izvedbo simulacij Monte Carlo pa je zmožnost generiranja slučajnih časovnih omrežij na podlagi lokalnih mehanizmov z izbrano vrsto bločnega modela in z izbrano razvrstitvijo za generirana omrežja v vsaki časovni točki. Trenutno ni pristopa, s katerim bi bilo mogoče generirati takšna omrežja. Pristopi za bločno modeliranje časovnih omrežij so še posebej primerni za proučevanje znanstvenega sodelovanja, opredeljenega s soavtorstvom (zaradi napak v podatkih, zakasnelih objav, …), saj olajšajo preučevanje opazovanih sprememb v času, kar je zelo pomembno v družbenih vedah. CILJI RAZISKAVE: V okviru predlaganega projekta bodo naslovljeni trije glavni cilji: (i) Evalvacija pristopov bločnega modeliranja časovnih omrežij z različnimi značilnostmi (različne gostote, različne stopnje fluktuacije enot, različno število enot v časovnih obdobjih, različne vrste sprememb bločnega modela in druge). (ii) Razviti algoritme za generiranje časovnih omrežij, z upoštevanjem lokalnih omrežnih mehanizmov, na način, da je mogoče globalno strukturo in razvrstitev za vsako časovno točko. Uporaba lokalnih mehanizmov omogočam, da so generirana omrežja bolj podobna realnim, znana globalna struktura in razbitje pa so potrebne ocenjevanje kakovosti dobljene rešitve bločnega modeliranja. (iii) Uporaba enega ali več pristopov bločnega modeliranja na časovnih soavtorskih omrežjih slovenskih raziskovalcev. Uporaba tovrstnih pristopov bo pripomogla k bolj veljavnim rezultatom preko bolj stabilnih razbitji in lažjega opazovanja sprememb v času.

Rezultati / ključne ugotovitve:

Osrednja rezultata projekta sta (i) algoritem za generiranje slučajnih časovnih omrežij z znano razvrstitvijo enot v skupin in znano bločno strukturo ter v skladu z lokalnimi omrežnimi mehanizmi in (ii) evalvacija (predvsem z uporabo tega algoritma) različnih pristopov za bločno modeliranje časovnih omrežij. Najprej smo torej razvili ustrezen algoritem za generiranje slučajnih omrežji za usmerjena omrežja, kjer so vse enote prisotne v vseh časovnih točkah ter ga uporabili za evaluacijo različnih pristopov na takih omrežjih (Cugmas in Žiberna, 2023). Med evalviranimi pristopi je tudi več pristopov, ki so jih razvili člani projekta, vključno s pristopom stohastičnega bločnega modeliranja za povezana omrežja (Škulj in Žiberna, 2022), ki je bil razvit v sklopu tega projekta. Glavne ugotovitve so, da so pristopi, ki hkrati upoštevajo več časovnih skupaj, v skoraj vseh primerih (razen ob izjemno nestabilnih skupinah) bolj učinkoviti kot pristopi, ki analizirajo vsako časovno točko posebej. Presenetljivo, rezultati kažejo, da se pristopi, ki so razviti za tako imenovana povezana omrežja, pogosto izkažejo kot bolj učinkoviti v primerjavi s pristopi, ki so razviti za posebej za časovna omrežja.

Dodatno smo razvili tudi algoritem za generiranje neusmerjenih omrežij, kjer lahko enote skozi čas tudi prihajajo in odhajajo. Algoritem in rezultati simulacij, kjer je bil uporabljen, so bili predstavljeni na več konferencah (npr. EUSN 2022, 2023), znanstveni članek pa je trenutno (marec 2024) v zaključevanju. Glavni zaključki so skladni s prej opisanimi (na podlagi usmerjenih omrežij). Kot omenjeno, smo v okviru projekta razvili tudi svoj pristop za stohastično bločno modeliranje časovnih omrežij. Rezultati simulacij kažejo, da je nov pristop v večini primerov boljši od obstoječih. Članek je trenutno v pripravi.

Prav tako smo s pomočjo pristopov, ki so se izkazali kot najbolj primerni, raziskali bločno strukturo slovenskih raziskovalcev v času od 1991 do 2020. Glavne ugotovite so, da se pomen disciplin v času zmanjšuje, pomen institucij ostaja velik, interdisciplinarnost pa se le počasi povečuje. Rezultati so bili predstavljeni na konferenci EUSN 2023, članek pa je tik pred oddajo.

Ključne besede:

bločno modeliranje, časovna omrežja, evalvacija metod, generiranje omrežij, so-avtorska omrežja, stohastične simulacije


Nazaj na seznam projektov