CORA

Center za Oblikovanje in Razvoj Aplikacij

print

Izdelali smo pilotno spletno aplikacijo Narečni frazem.

Slovarsko geslo je bilo zasnovano kot povezava standardov leksikografskega in dialektološkega dela s prednostmi obdelave s sodobnimi jezikovnimi tehnologijami. Logično nadaljevanje zasnove je nadgradnja gesla in realizacija e-slovarja narečne frazeologije na podlagi narečnega korpusa ter razširitev na vseslovenski narečni prostor. V prispevku predstavljamo spletno aplikacijo, ki bo skupnosti pomagala pri zbiranju narečnih frazemov. Aplikacija bo prosto dostopna.

 Novost pričujočega prispevka je nadgradnja interaktivnega e-slovarja, v katerega bo lahko vsak s pridobljenim geslom vnašal primere iz svojega govora – lahko bi rekli, da gre za zametek vseslovenskega narečnega frazeološkega e-slovarja.

 Ker je naš namen nadgradnja e-slovarja v vseslovenski frazeološki slovar, želimo spodbuditi zbiranje dialektološkega gradiva pri sodelovalni skupnosti (collaborative community – community), ki pa mora biti nadzorovana in usmerjana. Na tak način lahko v veliko krajšem času zberemo večje količine gradiva, potrebujemo le še nadzor nad kakovostjo, ki pa je pri – množičnem zunanjem izvajanju (crowdsourcing) vedno pereč problem. Nadzor nad kakovostjo vnosov ter možnost dopolnjevanja predvsem anonimnih vnosov je natančneje predstavljena v razdelku Primeri uporabe.

 

Osnovne lastnosti, ki so bile vodilo že pri samem snovanju orodja, so:

  • dostopnost: orodje omogoča vnos novih gradiv čim širšemu krogu uporabnikov;

  • enostavna uporaba: uporaba orodja ne sme odganjati potencialnih uporabnikov – možnost anonimne uporabe, enostavne zahteve po strojni opremi, enostavne osnovne operacije, predvsem vnos novega gradiva;

  • podpora fonetičnemu zapisu: podpora pisavi 00 ZRCola vnašalnega sistema ZRCola (Weiss 2004), podpora standardu IPA (Ladefoged 1990);

  • standardizirani vmesniki: orodje omogoča standardiziran prenos podatkov, podporo sodobnim vmesnikom: JSON, XML, TEI-P5 (TEI Consortium 2015).

 

Izdelali smo pilotno spletno aplikacijo Narečni frazem,v kateri poskušamo doseči vse opisane cilje. Aplikacija implementira spletno različico modela MVC (Model, View, Controller) (Moore et al. 2007). Temelji na preizkušenih in široko uporabljenih ogrodjih, ki se v zadnjih letih pogosto uporabljajo kot skupno ogrodje za snovanje spletnih aplikacij. CodeIgniter je ogrodje za izdelavo spletnih aplikacij, uporabljeno za strežniški del, AngularJS je ogrodje za izdelavo dinamičnih spletnih strani, uporabljeno za del aplikacije, ki se izvaja v brskalniku; ogrodje Bootstrap pa je bilo uporabljeno za osnovni izgled aplikacije.

 

Tak način izdelave aplikacij omogoča kar največjo fleksibilnost in posledično olajša spremembo aplikacije tudi v času uporabe, saj ne zahteva lokalne namestitve, preverjena ogrodja pa omogočajo hiter razvoj varnih aplikacij. Za uporabo je potreben le sodoben spletni brskalnik.

 

Pripravili smo tudi programski vmesnik API, tako da so vsi podatki dosegljivi s preprostimi http-klici v JSON-obliki, seveda ob ustrezni identifikaciji uporabnika.

 

frazem1

Slika 1: Spletna aplikacija za zbiranje narečnih frazemov. Uporabniški vmesnik je zasnovan tako, da uporabnik čim enostavneje in hitro opravi svoj vnos.

 

Aplikacija uporablja prosto dostopne jezikovnotehnološke servise za poenostavitev obdelave frazemov. Lematizacija in označevanje z oblikoskladenjskimi oznakami posameznih besed prevedenih oblik frazemov je mogoča s pomočjo spletnega servisa projekta JOS (Erjavec et al. 2010). Referenčni korpus slovenskega jezika GigaFida (Arhar Holdt et al. 2012) je uporabljen za iskanje pojavitev frazema v prevedeni osnovni obliki in tudi v posplošenih oblikah v obliki regularnih izrazov in lematiziranih oblik besed. Najdene frazeme lahko takoj opredelimo kot narečno nespecifične. Pomenska mreža slovenskih besed (Zupan 2013) je uporabljena za iskanje in opisovanje pomenske okolice posameznih besed (v lematizirani obliki) prevedenega frazema. To nam omogoča konceptualno analizo frazemov (pomensko podobne besede). Določanje geografske lokacije z uporabo programskega vmesnika Google Maps API) (Hu in Dai 2013) omogoča geolociranje frazemov, uporabnik ob vnosu novega frazema definira tudi območje, kjer je naletel na njegovo uporabo. To predstavlja osnovo za analize, ki temeljijo na geoprostorski umestitvi frazemov.

 

Aplikacija predvideva tri vrste uporabnikov: anonimni uporabniki, preverjeni uporabniki, uredniški odbor.

Primeri uporabe (use cases)

Pričakujemo štiri osnovne načine uporabe aplikacije. Anonimni vnos frazemov: navdušenci sami vpisujejo podatke o njim zanimivih narečnih frazemih, takšne vnose prevzamejo preverjeni uporabniki aplikacije, ki preverijo pristnost podatkov ter dopolnijo manjkajoče podatke. Pri tem si pomagajo s povezanimi jezikovnotehnološkimi servisi. Vnos frazemov preverjenih uporabnikov: preverjeni uporabniki, dialektologi vnašajo frazeme, ki so jih opazili pri svojih raziskavah ter pregledujejo gradiva anonimnih uporabnikov. Nadzor in urejanje gradiv: uredniški odbor, sestavljen iz izbranih preverjenih uporabnikov, odobri frazeme. Pregled slovarja: iskanje in pregled celotnega slovarja.

 

Slika 2: Frazem 1. ˈjəːt χ ˈMiːχc eno ˈJåːkcḁ <iti k Mihcu in Jakcu>. Samodejno so dodane oznake MSD-projekta JOS.