Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive

Tadić, Marko

Suvremena lingvistika, Vol. 43-44 No. 1-2, 1997.

Stručni rad

Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive

Marko Tadić ; Zavod za lingvistiku Filozofskoga fakulteta, Zagreb

Puni tekst: hrvatski pdf 124 Kb

str. 387-394

preuzimanja: 952

citiraj

APA 6th Edition

Tadić, M. (1997). Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive. Suvremena lingvistika, 43-44 (1-2), 387-394. Preuzeto s https://hrcak.srce.hr/23806

MLA 8th Edition

Tadić, Marko. "Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive." Suvremena lingvistika, vol. 43-44, br. 1-2, 1997, str. 387-394. https://hrcak.srce.hr/23806. Citirano 12.07.2026.

Chicago 17th Edition

Tadić, Marko. "Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive." Suvremena lingvistika 43-44, br. 1-2 (1997): 387-394. https://hrcak.srce.hr/23806

Harvard

Tadić, M. (1997). 'Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive', Suvremena lingvistika, 43-44(1-2), str. 387-394. Preuzeto s: https://hrcak.srce.hr/23806 (Datum pristupa: 12.07.2026.)

Vancouver

Tadić M. Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive. Suvremena lingvistika [Internet]. 1997 [pristupljeno 12.07.2026.];43-44(1-2):387-394. Dostupno na: https://hrcak.srce.hr/23806

IEEE

M. Tadić, "Računalna obradba hrvatskih korpusa: povijest, stanje i perspektive", Suvremena lingvistika, vol.43-44, br. 1-2, str. 387-394, 1997. [Online]. Dostupno na: https://hrcak.srce.hr/23806. [Citirano: 12.07.2026.]

Sažetak

Članak daje pregled obradbe hrvatskih korpusa. Navode se najvažniji korpusni projekti od
prvoga hrvatskoga računalno podržanoga korpusa - Gundulićev Osman (Bujas 1967), preko
Moguševa milijunskoga korpusa do današnjih dana. Nadalje se rad usredotočuje na Hrvatski
nacionalni korpus koji je središnji projekt na području korpusne lingvistike u Hrvatskoj danas.
Hrvatski nacionalni korpus (Tadić 1996) čine dvije sastavnice: 1) reprezentativni 30-milijunski
korpus suvremenoga hrvatskoga jezika (30M) i 2) Hrvatski elektronski tekstovni arhiv
(HETA). U prvoj fazi sastavljanja Hrvatskoga nacionalnoga korpusa naglasak je na zaokruživanju 30-milijunskoga korpusa, dok će se u drugoj fazi sav napor preusmjeriti na širenje
obuhvata Hrvatskoga elektronskog tekstovnoga arhiva. U sadašnjem stanju rad na 30-
milijunskom korpusu, koji bi trebao biti završen 2000, u fazi je uznapredovala planiranja i
javnoga testiranja probne inačice korpusa (7,68 milijuna pojavnica) putem WWW-a.

Ključne riječi

Hrčak ID:

23806

URI

https://hrcak.srce.hr/23806

Datum izdavanja:

28.5.1997.

Posjeta: 2.121 *

Prijava i registracija

Suvremena lingvistika, Vol. 43-44 No. 1-2, 1997.

Sažetak

Ključne riječi

Hrčak ID:

URI

Datum izdavanja: