Filologija, No. 84, 2025.
Original scientific paper
https://doi.org/10.21857/y26kecd1n9
Zašto su jezične tehnologije bitne za budućnost hrvatskoga jezika?
Marko Tadić
Abstract
U radu se daje definicija, sastav i pregled jezičnih tehnologija kao i rezultati dvaju velikih kampanja ocjene stanja razvoja jezičnih tehnologija za više desetaka europskih jezika u kojima je sudjelovao i hrvatski. Dok je u kampanji META-NET-a u 2011. hrvatski smješten u skupinu jezika s nedostatno razvijenim jezičnim tehnologijama, u kampanji European Language Equality 2022. našao se u skupini od dvadesetak jezika s djelomično razvijenim jezičnim tehnologijama i pokazao se relativan napredak. Međutim, u razvoju jezičnih tehnologija upravo su veliki jezični modeli uveli promjenu paradigme i pokazali kako će se veliki broj do sada razvijenih jezičnih alata morati iznova proizvesti s novom metodologijom u pozadini tj. onom koja koristi velike jezične modele. Dalje se u radu daje pregled osnovnih vrsta velikih jezičnih modela i objašnjava se razlika između umjetne inteligencije i velikih jezičnih modela. Rad se zaključuje ukazivanjem na potrebu trajnoga razvoja jezičnih tehnologija za hrvatski jezik i to upravo na temelju stalnoga razvoja novih velikih jezičnih modela za hrvatski jezik u skladu sa svakom njihovom novom arhitekturom koja se bude pojavila. Za to je potrebno osigurati do sada neviđene količine tektovnih podataka na hrvatskom jeziku. U protivnom, hrvatskom se jeziku može dogoditi “digitalna nepismenost” i ostanak onkraj digitalne razdjelnice.
Keywords
jezične tehnologije, hrvatski jezik, veliki jezični modeli
Hrčak ID:
339779
URI
Publication date:
24.11.2025.
Visits: 493 *