Original scientific paper
Gesetz zur Bestimmung des Wortschatzumfangs von Texten. Das Heaps'sche Gesetz und die Bestimmung der Wortschatzgröße in kroatischen Texten
Miroslav TUĐMAN
Abstract
Die bestehende Formel / Vr(n)=Knß / des Heaps'schen
Gesetzes zur Bestimmung des Wortschatzumfangs von Texten
hat keine universale Gültigkeit, sodass das Gesetz, soll es zur
Textkorpusanalyse in verschiedenen Sprachen angewandt
werden, redefiniert werden muss. Die Analyse von
Textkorpora in kroatischer Sprache bestätigt die Hypothese,
dass die Zahl funktionaler Wörter (F) in einem Text konstant
ist und 21% der Größe eines Textes n ausmacht (in
englischen Texten beträgt die Zahl funktionaler Wörter 26%).
Der Verfasser weist nach, dass der in einem Text vertretene
Prozentsatz funktionaler Wörter als Wertangabe für den
Parameter K benutzt werden kann und dass der Parameter K
einen gleichbleibenden Wert für jedes sprachliche Korpus
darstellt. Empirische Forschungen bestätigen die These des
Verfassers, dass die Zahl funktionaler Wörter in einem Text
mit der Formel F = nK/100 errechnet werden kann, dass
wiederum für die Größe der häufigsten Wörter (MF) die
Formel MF = n(K/100)2 gilt. Der zweite Parameter des
Heaps'schen Gesetzes kann ebenfalls genau bestimmt
werden: ß = log K/100. Der Verfasser schlägt daher vor, das
Heaps'sche Gesetz in neuer Form zu bestimmen:
Vr(n) = (Kn)ß. Die Zahl der nur einmal im Text
vorkommenden Wörter (HL) kann anhand der folgenden
Formel errechnet werden: HL = ((Kn)/2)ß. Forschungen haben
bestätigt, dass die errechneten und die wirklichen Werte des
Vokabularumfanges, bzw. dass die wirklichen und die
errechneten Werte von einmalig vorkommenden Wörtern in
einem Text in hohem Maße miteinander korrelieren. Ein
solchermaßen interpretiertes und definiertes Gesetz zur
Bestimmung des Wortschatzumfangs ermöglicht uns, den
Wortschatzumfang eines Textes in jeglicher Sprache
auszurechnen, hat man erst einmal den Prozentsatz
funktionaler Wörter, der für die betreffende Sprache
gleichbleibend ist, erstellt. Des Weiteren ermöglicht diese
Interpretation des Heaps'schen Gesetzes, die Zahl der
funktionalen Wörter, den Umfang der am häufigsten
vertretenen Wörter sowie die Zahl der einmalig
vorkommenden Wörter in einem Text zu bestimmen.
Keywords
Hrčak ID:
16266
URI
Publication date:
30.4.2005.
Visits: 3.448 *