Izvorni znanstveni članak
https://doi.org/10.31724/rihjj.50.2.1
Višejezično ugrađivanje riječi i lingvistički povezani otvoreni podatci za praćenje semantičkih promjena
Florentina Armaselu
; University of Luxembourg, Luxembourg
Barbara McGillivray
; King’s College London, United Kingdom
Chaya Liebeskind
; Jerusalem College of Technology, Israel
Paola Marongiu
; Institute of Computational Linguistics “Antonio Zampolli”, National Research Council (ILC-CNR), Italy
Giedrė Valūnaitė Oleškevičienė
; Mykolas Romeris University, Lithuania
Elena-Simona Apostol
; National University of Science and Technology Politehnica Bucharest, Romania
Ciprian-Octavian Truică
; National University of Science and Technology Politehnica Bucharest, Romania
Sažetak
U članku se predlaže kombiniranje metoda obrade prirodnog jezika za dijakronijsku analizu i jezično povezanih modela otvorenih podataka za otkrivanje i predstavljanje semantičke promjene. Promjena značenja tijekom vremena riječi, fraza ili pojmova obuhvaća složene pojave koje se ne mogu u potpunosti objasniti samo distribucijskim metodama. Tvrdimo da pridruživanjem korpusnih i leksikografskih dokaza i modeliranjem rezultata u interoperabilnom formatu može pružiti čvršći temelj za donošenje zaključaka i mogućnosti ponovne uporabe u drugim aplikacijama. Definiramo osnovnu shemu za agregator resursa i model pod nazivom LLODIA (Jezicno povezani otvoreni podaci za dijakronijsku analizu). Da bismo ilustrirali naš pristup, koristimo višejezični skup podataka, na francuskom, latinskom, hebrejskom, starom litvanskom i rumunjskom jeziku, i gradimo uzorak izveden iz ugrađivanja riječi i resursa rječnika, kodiran pomoću predloženog modela.
Ključne riječi
dijakronijsko ugrađivanje riječi; lingvistički povezani otvoreni podatci; semantička promjena; višejezični skupovi podataka
Hrčak ID:
329429
URI
Datum izdavanja:
31.12.2024.
Posjeta: 0 *