SciELO - Scientific Electronic Library Online

 
vol.57 issue2-1The causes of loneliness and the factors that contribute towards it: a literature reviewA principal's perspective on professional development: a single case study author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Article

Indicators

    Related links

    • On index processCited by Google
    • On index processSimilars in Google

    Share


    Tydskrif vir Geesteswetenskappe

    On-line version ISSN 2224-7912
    Print version ISSN 0041-4751

    Tydskr. geesteswet. vol.57 n.2-1 Pretoria Jun. 2017

    http://dx.doi.org/10.17159/2224-7912/2017/v57n2-1a7 

    ARTICLES

     

    Die aard, doel en omvang van die Afrikaanse Woordelys en Spelreëls. Deel 1

     

    The nature, goal, and scope of the Afrikaanse Woordelys en Spelreëls. Part 1

     

     

    GB (Gerhard) Van Huyssteen

    Sentrum vir Tekstegnologie (CTexT). Potchefstroomkampus, Noordwes-Universiteit. E-pos: gerhard.vanhuyssteen@nwu.ac.za

     

     


    OPSOMMING

    Toe die eerste Afrikaanse woordelys en spelreëls (AWS) meer as honderd jaar gelede gekonsipieer is, was dit nog nie standaard praktyk om die aard, doel en omvang van woordeboeke duidelik, omvattend en sistematies uit te spel in ʼn woordeboekkonseptualiseringsplan nie. In 2006 het die TK begin om twee dokumente saam te stel, naamlik ʼn stylgids (waarin kwessies soos die volgorde van etikette, alfabetisering, volgorde van los-, vas- en koppeltekenskryfvorme, inkortings, tipografie, en so meer aangeraak word) en riglyne vir die TK (waarin opname- en elimineringskriteria vir lemmas in die woordelysgedeelte van die AWS bespreek word). Geen van beide is tot op datum van publikasie van hierdie artikel formeel deur die TK goedgekeur of in die openbare domein beskikbaar nie. Die doel van hierdie artikel is om van daardie inligting te organiseer, daarop uit te brei en as ʼn operasionaliseringsraamwerk te formuleer. Met betrekking tot die aard van die AWS word die AWS binne ʼn groter woordeboektipologie gekarakteriseer as ʼn beperkte, eentalige, sinchroniese, linguisties-ensiklopediese naslaanbron. Die belangrikste doel van die AWS is om norme daar te stel vir die gebruik van hedendaagse, geskrewe, formele Standaardafrikaans. Met betrekking tot die omvang van die woordelysgedeelte in die AWS word daarop gewys dat lemmas in die AWS ʼn dubbele rol as woordeboekinskrywings vervul, naamlik as makro- én mikrostruktuurelemente. Verskeie opname- en elimineringskriteria wat die omvang van die AWS bepaal, word bespreek en aan die hand van verskeie voorbeelde toegelig.

    Trefwoorde: Afrikaans; Afrikaanse Woordelys en Spelreëls (AWS); elimineringskriteria; leksikografie; normatiewe taalkunde; opnamekriteria; ortografie; Suid-Afrikaanse Akademie vir Wetenskap en Kuns (SAAWK); Taalkommissie (TK)


    ABSTRACT

    When the first Afrikaanse woordelys en spelreëls (AWS) was conceived more than a hundred years ago, it was not yet standard practice to explicate the nature, goal and scope (for example with regard to inclusion and elimination criteria) of dictionaries explicitly in a dictionary conceptualisation plan. Through the years, the compilers of the AWS (i.e. the Language Commission ("Taalkommissie" (TK)) of the "Suid-Afrikaanse Akademie vir Wetenskap en Kuns") provided in the respective forewords of each new edition of the AWS indications of their specific perspectives, goals and methodologies. Until 2006, no internal (or public) dictionary conceptualisation plan of the AWS existed.
    From 2006 onwards, the TK endeavoured to compile a style guide (addressing matters such as the sequence of dictionary tags, alphabetisation, sequence of disjunctively and conjunctively written forms, treatment of clippings, typography, etc.), as well as methodological guidelines for inclusion and elimination of lemmas in the word-list section of the AWS. None of these documents have been formally approved by the TK, or have been released in the public domain. The aim of this article is to organise and interpret some of the information contained in these documents, to construct an operationalisation framework, and to make this information available for scientific scrutiny.
    With regard to the nature of the AWS (as a so-called spelling or orthography dictionary), it is characterised within a broader dictionary typology as a limited, monolingual, synchronic, linguistic-encyclopaedic reference work. As such, it shares certain similarities with standard monolingual dictionaries, specifically regarding the normative character of some of these dictionaries. One can therefore also say that it is the primary goal of the AWS to set norms and standards for using present-day, written, formal Standard Afrikaans.
    Regarding the scope of the word-list section of the AWS, this article argues that lemmas in the AWS has a bipartite function, serving simultaneously as macro- and microstructural dictionary elements. Numerous inclusion and elimination criteria that determine the scope of the AWS are discussed and illustrated with examples from the AWS.
    Macrostructural criteria include: (1) lexical items that could present potential spelling problems and problems of style; (2) the status of lexical items (taking the distribution and frequency of a lexical item in corpora into account); (3) lexical items that should be included for the sake of completing certain paradigms in the AWS (e.g. derivations of language names); (4) illustration material in the rule section of the AWS; and (5) physical limitations in the scope of a to-be-published book, set by a publisher.
    Microstructural criteria include: (1) linguistic correctness/motivation of lexical items; (2) institutionalisation of lexical items in other dictionaries; (3) frequency of lexical items (and specifically variant lemmas) in a variety of corpora; and (4) the dictionary style and editorial policy of the AWS.
    A few statistical models and techniques that could be considered by the TK when analysing corpus data are also discussed. The article concludes with a summative table that could serve as an operationalised frame of reference for the AWS. A few topics for further future research are also included.

    Keywords: Afrikaans; Afrikaanse Woordelys en Spelreëls (AWS); elimination criteria; inclusion criteria; lexicography; normative linguistics; orthography; Suid-Afrikaanse Akademie vir Wetenskap en Kuns (SAAWK); Taalkommissie (TK)


     

     

    1. INLEIDING

    In sy resensieartikel oor die negende uitgawe van die Afrikaanse Woordelys en Spelreëls (AWS)9) skryf Van Sterkenburg (2004:428): "Verder is de woordenlijst uitgebreid met nieuwe lemma's en met meer afleidingen en samenstellingen. Maar, over de wijze van selectie daarvan geen woord." Hy beveel dan ook verder aan: "Je moet als commissie een referentiekader hebben waaraan je alles kunt toetsen" (Van Sterkenburg 2004:428). In die moderne leksikografiepraktyk word so ʼn verwysingsraamwerk idealiter a priori in die leksikografiese stylgids (Bergenholtz 1990) omskryf, wat deel van die woordeboekkonseptualiseringsplan (Gouws & Prinsloo 2005:14) van enige woordeboek is.

    Toe die eerste AWS meer as honderd jaar gelede gekonsipieer is, was dit nog nie standaardpraktyk om die aard, doel en omvang (byvoorbeeld opname- en elimineringskriteria vir lemmas in die woordelysgedeelte) van woordeboeke duidelik, omvattend en sistematies uit te spel in ʼn konseptualiseringsplan nie. Die enigste aanduiding oor die aard van AWS1 vind ons in die voorwoord:

    Maar hoewel die spelreëls [wat op 18 September 1915 deur die Suidafrikaanse Akademie vir Taal, Lettere en Kuns goedgekeur is] die algemene beginsels bevat, is dit op sigself nie voldoende nie. Daar blij nog altoos baing gevalle van spelling oor wat veel beter in ʼn aparte woordelijs kan behandel word, omdat sodanige vorme daar veel makliker te vind is. Daarom het die Akademie opdrag gegee om ʼn Afrikaanse woordelijs saam te stel, in aansluiting bij, en ter aanvulling van die spelreëls. (AWS1:IV-V)

    Oor die doel - en veral die teikengebruikers - is dit duidelik dat die eerste Taalkommissie (TK) hom rig op die volwassewording van Afrikaans as (veral) onderwystaal:

    Vanself dus wil ons sôre dat ons taal in ieder opsig tot sij reg kom; dat dit die draer word van ons kultuur. Vandaar dat ons in die eerste plaas ons oog rig op die onderwijs. (AWS1:III)

    Reeds in AWS1 identifiseer die TK een van die belangrikste riglyne wat die omvang van die AWS oor die volgende eeu sou bepaal, naamlik dat prioriteit gegee word aan woorde wat potensieel spellingprobleme oplewer:

    Wat die aantal woorde betref, is dit die samestellers nie in die eerste plaas daarom te doen gewees om ʼn volledige lijs te gee van al die gebruiklike Afrikaanse woorde nie. Daarom het die samestellers hul veral bepaal bij die woorde, wat in meer of minder mate spellingmoeilikheid oplewer. Daarnaas is egter ook gestreef na ʼn redelike mate van volledigheid. Maar die grenslijn is dikwels vaag; en hoe maklik word ʼn woord nie uitgelaat als ʼn lijs vir die eerste keer saamgestel word nie. Die opname van vreemde woorde is met opset beperk, om die deur nie al te wijd oop te sit nie. (AWS1:VI)

    Twee ander kriteria, naamlik frekwensie en algemeenheid, word ook (hoewel indirek) reeds in die voorwoord van AWS1 gestel, en dit is twee beginsels wat ʼn eeu later - soos in hierdie artikel sal blyk - steeds geld:

    Wie ʼn woordelijs saamstel van woorde wat nog in algemene gebruik is, en daarby probeer om die mees algemene uitspraak weer te gee so iemand neem ʼn lastige taak op hom. Een versekering kan die samestellers darem gee, en dit is dat hul altoos daarna gestreef het om, na hul beste wete, die gebruiklikste, dus die beste uitspraak weer te gee. Waar verskillende uitsprake ewe gewoon is - wat dikwels die geval is, veral met ʼn jong taal - daar is ook verskillende vorme opgeneem. Te veel vrijheid kan nie gegee word nie; dit stig net verwarring. Aan die ander kant mag ons nie ons taal in ʼn dwangbuis forseer nie. (AWS1:V-VI)

    Met verloop van die jare is daar in elke voorwoord van elke nuwe uitgawe van die AWS duidelik gemaak wat die sienings en werkwyse van die TK('s) van daardie spesifieke uitgawe was (vergelyk ook McLachlan 2016). Behalwe vir oorlewering van TK tot TK of uitgawe tot uitgawe van die AWS, en behalwe vir besluite wat opgeteken is in die notules van TK-sittings (vergelyk Van Rensburg 2017), het daar tot en met 2006 geen formele stylgids of konseptualiseringsplan vir die AWS bestaan nie.

    In 2006 het die TK begin om twee dokumente saam te stel:

    Stylgids: In hierdie dokument is kwessies soos die volgorde van etikette, alfabetisering, volgorde van los-, vas- en koppeltekenskryfvorme, inkortings, tipografie, en so meer aangeraak. Die doel van die dokument is veral om inkonsekwenthede in die AWS te probeer uitskakel en is aanvanklik deur Mariëtta Alberts opgestel (en daarna verder uitgebrei en onderhou deur veral Gerhard van Wyk en Herman Beyer).

    Riglyne vir die Taalkommissie: Daar is begin om geformaliseerde riglyne, wat as opname- en elimineringskriteria vir lemmas in die woordelysgedeelte kan dien, vir die TK neer te lê. Ek en Tom McLachlan was die aanvanklike outeurs van dié dokument.

    Beide hierdie dokumente is dinamiese dokumente wat steeds organies groei; geen van beide is tot op datum van publikasie van hierdie artikel formeel deur die TK goedgekeur en as finaal "afgeteken" nie. Soos wat nuwe gevalle hulle voordoen, of soos nuwe insigte in die werkwyse van die TK verkry word, word die dokumente dienooreenkomstig aangepas.

    In hierdie artikel is die fokus laasgenoemde dokument. Die doel van die artikel is om die inligting daarin na my eie siening te organiseer, daarop uit te brei en as ʼn operasionaliseringsraamwerk te formuleer. In Van Huyssteen (2017) illustreer ek die toepassing daarvan aan die hand van ʼn toetsgeval. As sodanig is hierdie artikel dus my persoonlike (kritiese) beskouing van die aard, doel en omvang van die AWS en die werkwyse van die TK in die periode 2006 tot 2016. Ofskoon hierdie artikel van interne TK-dokumentasie gebruikmaak, is en bly dit my persoonlike interpretasie en verteenwoordig dit nie die amptelike standpunt van die TK nie; enige denk- of berekeningsfoute moet dus voor my deur gelê word. Ek hoop egter om hiermee van die kennis en werkwyse van die TK in die openbare domein beskikbaar te stel, sodat dit ook aan die normale praktyk van die wetenskaplike proses onderwerp kan word. Hopelik dra dit op dié wyse by tot die vakkundige diskoers oor die AWS en ander spelling- of ortografiewoordeboeke soos die AWS, ten einde uiteindelik tot nuwe insigte en metodologieë te lei.

    In afdeling 2 word die aard van die AWS in oënskou geneem, met spesifieke verwysing na die AWS se plek in ʼn groter woordeboektipologie en die ooreenkomste wat dit met standaard verklarende woordeboeke vertoon. Afdeling 3 sluit hierby aan waar besin word oor die doel van die AWS, ook met spesifieke aandag aan die normatiewe aard en preskriptiewe funksie van ʼn bron soos die AWS. In afdeling 4 word verskeie opname- en elimineringskriteria wat die omvang van die woordelysgedeelte in die AWS bepaal, bespreek en aan die hand van verskeie voorbeelde toegelig. Die artikel word afgesluit met ʼn samevattende tabel wat myns insiens as geoperasionaliseerde "referentiekader" vir die AWS kan dien (dit is deur Van Sterkenburg (2004:428) as ʼn leemte uitgewys), asook met ʼn lys onderwerpe wat in die toekoms verder nagevors kan word.

     

    2. DIE AARD VAN DIE AFRIKAANSE WOORDELYS EN SPELREËLS

    By gebrek aan empiriese gegewens oor gebruikers se siening van wat die AWS is of behoort te wees, word die aanname hier gemaak dat daar uiteenlopende sieninge is oor die aard van die AWS. Daar word gepostuleer dat sommige gebruikers dit sien as 'n woordeboek, ander as 'n naslaanbron, ander as 'n reëlboek; dat sommige wil hê dit moet 'n normatief-preskriptiewe handleiding wees, terwyl ander wil hê dit moet 'n sinchronies-deskriptiewe beeld van hedendaagse Afrikaans weergee. Sulke uiteenlopende verwagtinge is nie vreemd ten aansien van ʼn normatiewe bron soos die AWS nie.

    Hierdie verskillende verwagtinge lei veral tot verwarring oor wat van die TK verwag word om te doen en hoe dit gedoen moet word. Dié kwessie kan gedeeltelik uitgeklaar word deur 'n duidelike en eenduidige karakterisering van die aard van die AWS te gee.

    Aangesien die AWS primêr uit twee dele bestaan (d.i. die woordelys en die spelreëls), het dit 'n distinktiewe karakter, sodat dit nóg as woordeboek, nóg as grammatika/handboek beskou kan word. Dit is eerder 'n hibridiese naslaanbron met eienskappe van sowel woordeboeke as taalkundige grammatikas en selfs ʼn ensiklopedie, soos hier onder aangedui sal word (vergelyk die inhoudsopgawe van AWS11).

    Gebaseer op die bekende tipologie van Zgusta (1971), kan die AWS (en moontlik ook ander sogenaamde spelling- of ortografiewoordeboeke (Singh 1982)) geklassifiseer word as 'n beperkte, eentalige, sinchroniese, linguisties-ensiklopediese naslaanbron:

    Beperk: Die beperking van die AWS lê daarin dat dit

         'n beperkte skopus het -

           in die woordelys word slegs 'n beperkte deel van die volledige Afrikaanse leksikon beskryf, te wete

                   • leksikale items in geskrewe, formele Standaardafrikaans

                  • waar daar moontlik twyfel kan wees oor die

                  skryfwyse/spelling; en/of

                  status; en

    in die spelreëls word slegs reëls opgeneem met betrekking tot die ortografiese konvensies van Afrikaans, terwyl sintaktiese, semantiese en pragmatiese aspekte (soos woordvolgorde, betekenisuitbreiding en styl) nie in die AWS bereël word nie - en

    'n beperkte doel het (kyk afdeling 3 hier onder).

    Eentalig: Die AWS fokus slegs op Afrikaans, sonder om vertalings in ander tale aan te bied. Vir die eerste keer in honderd jaar bevat sommige van die bylae in AWS11 wel 'n Engelse vertaalekwivalent, soos die Engelse landname en name van elemente in die periodieke tabel. Die insluiting van Engelse vertaalekwivalente verander egter nie aan die eentalige aard en doel van die AWS nie; dit kan eerder as ensiklopediese inligting gesien word wat toeligtend is tot die Afrikaanse inskrywings (sien hier onder).

    Sinchronies: Die AWS fokus slegs op hedendaagse Afrikaans. Die AWS word met gereelde tussenposes hersien en bygewerk om juis veranderinge in die woordeskat en ortografie op te teken.

    Linguisties-ensiklopedies: Benewens die alfabetiese woordelys, bevat die AWS ook ensiklopediese inligting, waarvan die spelreëls en die bylaes die belangrikste is. Die spelreëls is weliswaar linguistiese inligting, maar dit word op ensiklopediese wyse aangebied (tipies alfabeties gerangskik volgens die aspekte van die ortografie, maar met besprekings, kommentaar, opmerkings, voorbeelde, uitsonderings, en so meer). Hiernaas verskyn daar ook van tyd tot tyd bylaes in die AWS, soos ʼn afkortingslys (vanaf AWS5), lys buitelandse geografiese eiename en hulle afleidings (vanaf AWS9), terminologielys (vanaf AWS9), riglyne vir die skryf van Omgangsafrikaanse woorde (vanaf AWS9), riglyne vir transliterasie (vanaf AWS10), en so meer. Vanaf AWS11 word nog meer ensiklopediese inligting ingesluit (dikwels met Engelse vertaalekwivalente as toeligtende materiaal daarby), soos die lys met elemente in die periodieke tabel; ʼn lys met plekname in die Ooste; ʼn lys met landname, hulle geldeenhede en ISO-kodes; en gebruiksriglyne vir die SI-stelsel. Die ensiklopediese aard van sommige van hierdie inligting blyk onder andere uit die organisering daarvan: Die bylae met plekname in die Ooste is byvoorbeeld nie alfabeties gerangskik soos wat ʼn mens in ʼn tradisionele (linguistiese) woordeboek sou verwag nie, maar volgens land, provinsie/streek, ensovoorts. ʼn Gebruiker sou ook AWS11 kon gebruik om te sien watter lande in 2017 deur die Verenigde Nasies erken is, of wat die geldeenheid van ʼn bepaalde land is. In ʼn tradisionele linguistiese woordeboek sal sulke inligting nie tematies aangebied word nie, maar eerder alfabeties.

    Die AWS toon verder ook bepaalde ooreenkomste met standaard verklarende woordeboeke/handwoordeboeke. Opsommend kan die volgende karakteristieke van sodanige woordeboeke wat op die AWS (in die geheel) van toepassing is, genoem word (na aanleiding van Gouws 1989:69-70):

    Vanweë die gerigtheid van sodanige woordeboeke om 'n weergawe van die standaardtaal te gee, het dit 'n duidelike normatiewe karakter.

    As normatiewe naslaanbron word dit as 'n gesaghebbende bron beskou (kyk hier onder).

    Betekenisverklarings en lektiese variasie (byvoorbeeld sosiolekte en dialekte, asook vak- en ander kringtale) val buite die AWS se regstreekse reikwydte (en wanneer uitsonderings hierop gemaak word, geld gebruiksfrekwensie as kriterium, en word die lemma dikwels van 'n etiket voorsien).

    Die AWS is op die hede en die toekoms gerig en gee dus min aandag aan etimologiese en historiese inligting of aan verouderde taalgebruik.

    Dit het primêr 'n preskriptiewe funksie omdat dit nie net 'n aanduiding gee van hoe die taal in die hede gebruik word nie (die deskriptiewe funksie), maar ook hoe dit na verwagting nog vir 'n tyd lank gebruik sal word.

    Laasgenoemde punt is veral van kernbelang vir die AWS, aangesien dit saamgestel word deur die TK, as geïnstitusionaliseerde liggaam wat die ortografie en skryfkonvensies van Afrikaans bepaal. Ofskoon die status van die TK en AWS nooit direk deur middel van wetgewing geïnstitusionaliseer is nie (soos byvoorbeeld die geval in Nederland deur middel van die Spellingwet (Nederland 2005) is), het ʼn formele proklamasie van die Sekretaris van Onderwys op 15 September 1932 bepaal dat die Woordeboek van die Afrikaanse Taal (WAT) die Taalkommissiespelling moet aanvaar. Hierdie gesag van die TK oor die spelling en skryfwyse van Afrikaans is in 1933 verder bevestig toe die toenmalige minister van Binnelandse Sake, JH Hofmeyr, opdrag aan die staatsvertaler gegee het om die TK-spelling in alle staatspublikasies te volg (Van Rensburg 2017). In die Wet op die Suid-Afrikaanse Akademie vir Wetenskap en Kuns (54 van 1959) is ook bepaal dat, ten einde sy oogmerke te bereik, die Suid-Afrikaanse Akademie vir Wetenskap en Kuns (SAAWK) "norme [kan] bepaal ten bate van die gebruik en ontwikkeling van die Afrikaanse taal in al sy funksies".

    As sodanig was dit nog altyd die TK se eksplisiete opdrag om die spellingkonvensies van Afrikaans te bepaal en te bereël. In ʼn reglement van die SAAWK (hersiene weergawe goedgekeur in September 2015) word die mandaat van die TK bepaal:

    Die Taalkommissie is die liggaam van die Suid-Afrikaanse Akademie vir Wetenskap en Kuns wat hom, onderworpe aan die gesag van die Akademieraad, besig hou met die voortgesette standaardisering en beskrywing van Standaardafrikaans as gebruiksvariëteit, met inbegrip van die spelling, skryfwyse, punktuasie en grammatika daarvan, en van die variëteite van verskillende gebruikersgroepe. Hierdie werksaamhede sluit advies en voorligting oor Standaardafrikaans aan die Akademie en die breë publiek in.

    Gegewe hierdie normatiewe opdrag van die TK en die preskriptiewe aard van die AWS, en gegewe die dinamiek van taal en taalgebruikers, is dit nie verbasend dat daar dikwels 'n spanning tussen (ingeligte) taalgebruikers (die "skrywende volk", byvoorbeeld subredakteurs, terminoloë, leksikograwe, vertalers, ensovoorts) se heersende praktyk en die AWS se norme/reëls kan ontstaan nie. Ten einde hierdie spanning op te los, is dit dus noodsaaklik dat sowel die TK as eindgebruikers 'n ooreenstemmende siening moet hê van wat die doel van die AWS is.

     

    3. DIE DOEL VAN DIE AWS

    Die doel van die AWS is tweërlei van aard, naamlik om:

    (1) (preskriptiewe) norme daar te stel vir die gebruik van hedendaagse, geskrewe, formele Standaardafrikaans; en

    (2) as ekspertnaslaanbron oor skryfnorme vir gebruikers van Afrikaans te dien.

    Die AWS is die resultaat van die TK se normeringswerk in Afrikaans oor meer as 'n eeu en word beskou as "dié normatiewe gesagsbron oor Afrikaanse spelling" (Carstens 2011:146). Ten spyte hiervan is daar soms steeds kritiek dat die AWS nie normatief genoeg is nie: "Ik vind dat de 'Taalkommissie' niet prescriptief of normatief genoeg is geweest. Er blijft veel te veel optioneel; er blijft ook veel te veel variatie toegestaan" (Van Sterkenburg 2004:430, oor AWS9).

    Oor die verwagtinge van eindgebruikers merk Heid et al. (2004) op: "The most important criterion is the user perspective: the intended use and usergroup of a dictionary, the prior knowledge and the needs of the users." Drie aspekte moet hiervolgens in gedagte gehou word:

    Gebruikersgroep: By gebrek aan gebruikersgebaseerde navorsing oor die AWS, word dit in hierdie artikel aanvaar dat die primêre gebruikersgroep volwasse moedertaalsprekers van Afrikaans is wat versorgde, geskrewe Afrikaans/Standaardafrikaans wil gebruik (meestal binne 'n professionele omgewing).

    Voorkennis van gebruikersgroep: Daar word in hierdie artikel vooronderstel dat die primêre gebruikers van die AWS ʼn goeie (maar nie gevorderde nie) kennis van geskrewe Afrikaans, die Afrikaanse spelsisteem en skryfkonvensies het. Die vooronderstelling hier is dat gebruikers wat nie 'n goeie kennis van Afrikaanse skryfwyses het nie, meestal nie bewus van bepaalde spelreëls of skryfkonvensies is nie, of dat hulle hulle dikwels tot ander, meer algemene bronne soos die Handwoordeboek van die Afrikaanse Taal (HAT), of slegs tot die woordelysgedeelte van die AWS wend.

    Behoeftes van gebruikersgroep: Die aanname word hier gemaak dat gebruikers se eerste toegang tot die AWS die woordelysgedeelte is (eerder as om die reëlgedeelte te raadpleeg). Indien die opgesoekte leksikale item nie gevind word nie, sal eindgebruikers waarskynlik eers probeer om "eie reëls" af te lei uit omstaande of soortgelyke voorbeelde, alvorens hulle hulle tot die reëlgedeelte wend. Myns insiens het gebruikers van die AWS meestal een van die volgende primêre behoeftes:

          Leiding met betrekking tot spelling/skryfwyse (Hoe skryf/spel ek X?)

          Leiding met betrekking tot erkenning/status van 'n leksikale item (Is X 'n erkende Standaardafrikaanse woord?) (Byvoorbeeld: Is "app" ʼn erkende Standaardafrikaanse woord?)

          Leiding met betrekking tot fleksie of afleiding van, of samestellings met 'n leksikale item (Wat is X se Y-vorm?) (Byvoorbeeld: Wat is "slu" se oortreffende trap?, of: Is dit "werkswinkel" of "werkwinkel"?)

    Sekondêre behoeftes sou die volgende kon insluit:

         Leiding met betrekking tot spelreëls (Wat is die reël waarom X so geskryf word?)

        Leiding met betrekking tot die Afrikaanse grammatika (byvoorbeeld: Wat is 'n massanaamwoord? Hoe tree massanaamwoorde in Afrikaans op?)

    Soos blyk uit die feit dat bostaande bloot vooronderstellings is, moet al hierdie aannames nog in die toekoms deeglik empiries nagevors word. Dit is die taak/verantwoordelikheid van die TK om in sy normeringswerk te sorg dat die behoeftes van die gebruikersgroep deeglik in ag geneem word en hanteer word op 'n vlak wat vir die eindgebruikers aanvaarbaar is.

    Met betrekking tot normering (d.i. standaardisering) sover dit die ortografie van ʼn taal betref, kan die volgende drie algemene uitgangspunte gestel word:

    Normering moet gebruikergerig wees: Gebruikers wil antwoorde hê op wat reg en wat verkeerd is (Carstens 2011:17). Daarom moet ʼn woordeboek soos die AWS klinkklaar en ondubbelsinnig antwoorde aan gebruikers verskaf.

    Normering moet kontroleerbaar wees: By gebrek aan empiriese ondersteuning word die status van norme tans op basis van die oordele van taalkundiges en taalpraktisyns bepaal. Dit kan egter nie willekeurig bepaal word nie (Carstens 2011:18), maar moet berus op "objektiewe waarneming" deur "teoreties geskoolde taalkundiges" (volgens De Villiers 1977:2) en ervare taalpraktisyns (myns insiens) wat bevoeg is om tussen die norm en afwykings van die norm te onderskei. Voortspruitend moet die normeerder (d.i. die TK) deeglik oor die status van die bron(ne) van norme besin (byvoorbeeld korpusse, ander woordeboeke, of taalkundige navorsing) en waaraan dit gemeet word.

    Normering moet sistematies wees: Alle norme moet aan die taalsisteem voldoen, met inagneming van (a) hoe taal (in die algemeen) teoreties inmekaarsteek, (b) hoe die spesifieke taal prakties gebruik word, en (c) wat die status van relevante taaldata is (Carstens 2011:18). Dit impliseer ook dat die TK kennis moet neem van moontlike veranderinge wat in die taalsisteem kan intree en op verantwoordbare wyse leiding gee oor sodanige verandering.

    Hierdie drie karakteristieke van normering mag voor die hand liggend wees, maar Carstens (2011:19-20) wys tereg daarop dat dit egter in die praktyk die moeilike vraag oproep: Wanneer en hoe kry deskripsie'n preskriptiewe funksie? ʼn Liggaam soos die TK is veronderstel om ʼn sinchroniese beskrywing te verskaf van die variëteit van Afrikaans wat algemeen in formele, geskrewe kontekste gebruik word (oftewel Standaardafrikaans), maar gebruikers verwag egter van die TK om preskriptief op te tree. Dit lei onteenseglik tot ʼn metodologiese spanning waar daar ʼn balans tussen beskrywing en voorskrywing gevind moet word. In die "Werkwyse"-afdeling in AWS11 word dit soos volg verwoord:

    Dit is dus altyd vir die Taalkommissie noodsaaklik om 'n goue middeweg te vind tussen enersyds voorskrywing (soos wat taalgebruikers dikwels van hom verwag), en andersyds beskrywing (soos wat die taalkundige dikwels van hom verwag). Daar moet dus 'n ewewig gehandhaaf word tussen wat vir die gemiddelde ingeligte gebruiker verstaanbaar en aanneemlik is, en wat vir die taalkundige aanneemlik en wetenskaplik verantwoordbaar is.

    In die samestelling van ʼn ortografiewoordeboek (soos die AWS) is dit myns insiens ononderhandelbaar dat besluite en uitsprake wetenskaplik begrond word deurdat dit ten minste taalkundig verantwoordbaar moet wees (kyk uitspraak van De Villiers (1977) hier bo). Al moet die TK dus ingevolge sy mandaat en gebruikersverwagtinge preskriptief optree, moet sodanige voorskrywings/normering op goeie wetenskaplike gronde fundeer word (wat objektiewe waarneming (byvoorbeeld van korpusdata) en subjektiewe intuïtiewe oordeel gebaseer op ervaring insluit - vergelyk Tarp en Fuertes-Olivera (2016:275)). Dit moet gedoen word binne 'n raamwerk van ʼn stel riglyne wat die sistematiek en kontroleerbaarheid van sy werk verhoog. Alle besluite moet verdedigbaar wees en nie bloot idiosinkraties (of, erger, ideologies) wees nie.

    In die res van hierdie artikel word slegs gefokus op die woordelysgedeelte van die AWS. Daar word eerstens spesifiek ʼn stel riglyne nagevors aan die hand waarvan inskrywings in die woordelys makrostruktureel opgeneem of weggelaat kan word. Tweedens word ʼn beskrywing gegee van die mikrostrukturele data wat oor opgeneemde lemmas verskaf word.

     

    4. DIE OMVANG VAN DIE AFRIKAANSE WOORDELYS EN SPELREËLS: OPNAME- EN ELIMINERINGSKRITERIA

    Gouws en Prinsloo (2005:65) stel dit duidelik dat "[i]t is important that the compilation of any dictionary must be dominated by well-defined principles regarding the collection and selection of lexical items to be included as lemmata." De Schryver en Prinsloo (2001:375) sluit hierby aan: "One could say that setting up a dictionary's lemma-sign list is the first major problem with which any lexicographer is confronted", soos ook bevestig word deur Tomaszczyk (1983:51): "One of the basic problems of lexicography is to decide what to put in the dictionary and what to exclude."

    In die leksikografie word ʼn onderskeid tussen die makro- en mikrostruktuur van ʼn woordeboek getref: "Die makrostruktuur verwys na die lemmakeuse terwyl die mikrostruktuur verwys na die interne struktuur van elke artikel", d.i. die tipes inligting wat by elke lemma aangebied word, soos grammatiese inligting, uitspraakleiding, betekenisverklaring, voorbeeldsinne, ensovoorts (Gouws 1989:40). Gouws (1989:75) wys daarop dat lemmas ʼn dubbele rol as woordeboekinskrywings vervul, aangesien hulle as makro- én mikrostruktuurelemente optree:

    As makrostruktuurelemente verteenwoordig die lemmas daardie versameling woordeskat-elemente wat leksikografies bewerk moet word en funksioneer elke lemma as die kop van ʼn woordeboekartikel. As mikrostruktuurelement vorm elke lemma ʼn onderdeel van ʼn woordeboekartikel. Wat dié optrede betref, is ʼn lemma leksikografies gelykwaardig aan die ander inskrywings van die betrokke artikel.

    Dit is des te meer en by uitstek waar vir lemmas in ʼn ortografiewoordeboek soos die AWS. In byvoorbeeld ʼn vertalende woordeboek is ʼn gebruiker primêr geïnteresseerd in die mikrostruktuur van die woordeboekartikel: H/sy wil ʼn vertaalekwivalent/die vertaalekwivalente van ʼn opgeneemde lemma vind; die lemma is dus eintlik die sleutel wat toegang bied tot die inligting waarna die gebruiker eintlik soek. In ʼn ortografiewoordeboek bevat die lemma sélf die inligting waarna die gebruiker primêr soek, naamlik hoe om ʼn leksikale item te spel/skryf, of wat die status van ʼn bepaalde leksikale item in Standaardafrikaans is; die lemma is dus die sleutel én die inligting. Die vraag oor wat opgeneem moet word, is dus gelyktydig ook die vraag hoe dit opgeneem moet word.

    In elk van die elf uitgawes van die AWS (1917; 1918; 1921; 1931; 1937; 1953; 1964; 1991; 2002; 2009; 2017) gee elk van die TK's op hul eie direkte of indirekte manier rekenskap van die werkwyse wat in die samestelling van die betrokke uitgawe se woordelys gevolg is. Vergelyk byvoorbeeld die werkwyse wat gestel word in die voorwoord van AWS1 (1917:IV; sien die aanhaling in afdeling 1 hier bo), of in die afdeling "Werkwyse" in AWS11 (2017) waar gestel word:

    dat die woorde wat in die Woordelys opgeneem word aan soveel as moontlik van die volgende maatstawwe moet voldoen:

    (1) Dit moet taalkundig korrek wees in ooreenstemming met die grondbeginsels van die Afrikaanse spelling- en skryfsisteem.

    (2) Dit moet met ʼn relatief hoë frekwensie in ʼn verskeidenheid hoëfunksiepublikasies voorkom.

    (3) Dit moet opgeneem wees in ander gesaghebbende woordeboeke of taalkundige bronne.

    (4) Dit moet moontlik spelling- of skryfprobleme vir gebruikers inhou.

    (5) Die erkenning daarvan as deel van Standaardafrikaans is nodig, veral ook met betrekking tot woorde of frases wat unieke benoemers van (nuwe) konsepte is.

    (6) Opname is wenslik ter wille van paradigmatiese volledigheid.

    (7) Dit moet hedendaagse Afrikaans wees of waarskynlik kan voorkom in hoëfunksiepublikasies wat (nog) deur die huidige geslag Afrikaanssprekendes gelees en gebruik word.

    (8) Dit moet, in die lig van die gebruik van standaardtaal vir hoër funksies, die geskrewe gebruik deur die Afrikaanse taalgemeenskap in sulke funksies weerspieël.

    (9) Dit moet sosiaal, kultureel en politiek sensitief wees.

    Hierdie nege maatstawwe kan breedweg in twee interafhanklike kategorieë verdeel word, naamlik kriteria wat:

    (a) die makrostruktuur van die AWS bepaal (d.i. of ʼn leksikale item enigsins oorweeg moet word vir opname/skrapping); en

    (b) betrekking het op die lemma as mikrostrukturele element in die AWS (d.i. hoe ʼn leksikale item opgeneem moet word).

    4.1 Makrostrukturele kriteria

    Die sentrale vraag met betrekking tot die makrostrukturele kriteria is: Moet die leksikale item vir opname (of skrapping) oorweeg word? In dié verband is die oorkoepelende kriterium bruikbaarheid, wat deur Gove (1961:4a) as 'n belangrike seleksiekriterium geïdentifiseer word: "Selection is guided by usefulness, and usefulness is determined by the degree to which terms most likely to be looked for are included." Teen die agtergrond van veronderstelde gebruikersverwagtinge moet die TK dus die leksikale items en reëls opneem waarna die veronderstelde eindgebruiker waarskynlik sal soek as hy/sy die AWS raadpleeg. Die volgende kriteria geld (myns insiens in volgorde van belangrikheid vir die veronderstelde gebruiker):

    Spelling- en skryfprobleme (kyk punt (4) hier bo): ʼn Hoëfrekwensiewoord soos sit sal minder geredelik opgeneem word as ʼn woord soos masjinis, gewoon omdat laasgenoemde waarskynliker deur ʼn gebruiker opgesoek sal word.

    As elimineringskriterium kan deursigtigheid gebruik word om die woordelysgedeelte te verklein: Indien 'n mens uit die leksikale item se onderdele kan aflei hoe dit gespel of geskryf moet word, hoef dit nie noodwendig opgeneem te word nie. Hier gaan dit oor die verhouding tussen reëls en lyste: As 'n leksikale item genoegsaam deur die reëls ondervang word, is dit minder noodsaaklik om die leksikale item op te neem. Soos die samestellers van die Nederlandse Het Groene Boekje tereg opmerk: "Daarom werden veel samenstellingen geschrapt waarvan de spelling blijkt uit gelijksoortige gevallen" (Instituut voor Nederlandse Lexicologie 2005).

    Status (kyk punt (5) hier bo): Gebaseer op informele terugvoer van eindgebruikers (soos studente), asook op eie ervaring, weet ons dat die woordelys dikwels gebruik word om te bepaal of ʼn bepaalde leksikale item ʼn "erkende woord in Afrikaans" is. Iemand wat byvoorbeeld wil weet of karnivoor (naas vleiseter) ʼn erkende Afrikaanse woord is, sou die woord in die woordelys kon naslaan. Hierdie kriterium geld dikwels vakterme, rekenaarterme, nuutskeppings, unieke benoemers (byvoorbeeld die werkwoorde netwerk en teks; of fyngoed vir bokke en skape, en grofgoed vir grootvee en trekdiere), en so meer. Dit kan ook gebruik word as motivering vir die opname van leksikale items wat dalk meer gewestelik of van spesifieke kulturele belang is (kyk punt (9) hier bo), maar wat dalk tog ʼn plek in die breër Afrikaanse gemeenskap sou kon kry, byvoorbeeld brötchen ("soort broodjie"; word meestal in Namibië gebruik), ghoemahare ("spookasem"; word meer algemeen in die Wes-Kaap gebruik), of motjie ("bejaarde vrou"; word meestal in die Moesliemgemeenskap gebruik). Uiteraard moet ʼn liggaam soos die TK uiters omsigtig te werk gaan om byvoorbeeld nie net op een variëteit te fokus nie, of om byvoorbeeld nie hipermoralisties of polities op te tree nie.

    As elimineringskriterium dien hierdie kriterium ook om verouderde leksikale items, of leksikale items wat sosiaal, kultureel of politiek onsensitief is uit die AWS te skrap (kyk punt (9) hier bo). Voorbeelde van verouderde leksikale items wat in AWS10 voorgekom het, maar nie meer in AWS11 nie, sluit in fransbrandewyn, hoegrootheid, juts en KGB-agent, en voorbeelde van onsensitiewe leksikale items sluit in idioot-savant, Kakie, mongool en bruinman/swartman/witman.

    Om die status van ʼn leksikale item in hedendaagse Standaardafrikaans te bepaal, word veral twee subkriteria in ag geneem:

    Spreiding (kyk punt (7) en (8) hier bo): In afdeling 2 is genoem dat die skopus van die AWS in wese beperk is tot geskrewe, formele Standaardafrikaans. Leksikale items behorende tot beperkte sosiale, geografiese of vakkundige groepe/domeine behoort nie in die woordelys opgeneem te word nie, behalwe waar sodanige leksikale items ook algemeen in die standaardvariëteit gebruik word (byvoorbeeld in koerante), of waar erkenning van unieke benoemers nodig is. Daarteenoor behoort die spelreëls wel eksplisiet voorsiening te maak vir die spelling en skryfwyses van Standaardafrikaans in gespesialiseerde kontekste, byvoorbeeld in vaktaal. Die skrywer, teksredakteur of vertaler van ʼn gespesialiseerde teks moet dus steeds die AWS as rigtinggewende bron kan gebruik, selfs al word spesifieke terme en uitdrukkings nie in die woordelys opgeneem nie.

    Frekwensie (kyk punt (2) hier bo): Ten einde patrone te bepaal vir die formulering van spelreëls, of om op die spelling of skryfwyse van ʼn bepaalde leksikale item te besluit, kan korpusfrekwensie as 'n kriterium in samehang met ander kriteria in ʼn spesialiswoordeboek soos die AWS gebruik word: "In practice, corpus frequency is only one of several selection criteria" (Heid et al. 2004). Die gebruik van frekwensie as kriterium moet egter verantwoordelik hanteer word: Die feit dat 'n bepaalde vorm frekwent voorkom, waarborg nie noodwendig die taalkundige korrektheid daarvan nie (vergelyk byvoorbeeld Reynaert (2009) se navorsing oor die hoë frekwensie van spelfoute in korpusse). Die belangrikste vraag hier is: Wanneer dikteer frekwensie van gebruik die norm? Om die balans te vind tussen beskrywing en voorskrywing, moet daar op verantwoordbare en (sover moontlik) wetenskaplike wyse met korpusdata omgegaan word, al is dit nie altyd in praktyk volkome moontlik nie (weens, byvoorbeeld, gebrek aan hulpbronne en tyd).

    Twee aspekte is in dié verband van belang. In die eerste plek is dit noodsaaklik om te bepaal wat as korpus(se) dien. Gouws en Prinsloo (2005: 65) stel die ideaal: "The lemmata have to be drawn from a representative corpus of the specific language and a vital part of the planning of any lexicographic endeavour is the development of a corpus." Vir ʼn hulpbronskaars taal soos Afrikaans is dit makliker gesê as gedaan, veral aangesien uitgewers en mediahuise dikwels huiwerig is om hulle data as (kommersiële) korpusse beskikbaar te stel. Dit word dus moeilik om ʼn betroubare, verteenwoordigende en gebalanseerde korpus as basis vir die bepaling van frekwensietellings saam te stel. In dié verband het die TK in 2005 begin om ʼn verwysingskorpus vir leksikografiese doeleindes (d.i. " any collection of texts where lexicographers can find inspiration for completing the dictionary structures they need when making a real dictionary" (Fuertes-Olivera 2012:51) saam te stel. Die korpus (Taalkommissie 2011) bestaan uit ongeveer 57 miljoen woorde, waarvan nagenoeg 27 miljoen woorde uit niefiksie-, nieakademiese tekste soos koerante, tydskrifte, godsdienstige geskrifte, notules en ander boeke kom; ongeveer 6 miljoen woorde uit fiksie kom; en 24 miljoen woorde uit akademiese tekste soos artikels, studiegidse en proefskrifte kom (kyk TABEL 1 vir die gedetailleerde stratum). Ander korpusse van (veronderstelde) geredigeerde teks wat op die webwerf van die Virtuele Instituut vir Afrikaans (VivA) (2016) beskikbaar is, word ook geraadpleeg, tesame met soektogte in die WAT as korpus, die Afrikaanse korpus van Projekt Deutscher Wortschatz (2016; voortaan Leipzigkorpus) en ander soortgelyke hulpbronne. Desalnietemin is dié versamelings tekste dikwels steeds te klein om klinkklare afleidings of statisties betroubare gevolgtrekkings te maak, en dan word daar van Googlesoektogte gebruikgemaak om tendense buite beskikbare korpusse na te speur. Só ʼn gebruik van Google (of ander soekenjins) word deur Fletcher (2005) "web hunting" genoem, d.i. om websoektogte te gebruik om seldsame voorkomste van konstruksies (wat nie noodwendig in standaardkorpusse voorkom nie) te soek. Van Huyssteen (2016) toon byvoorbeeld aan dat slegs die ortografiese vorme Ou Testamenties en Ou-Testamenties in die korpusse op VivA se Korpusportaal (2016) aangetref word, terwyl ʼn allesomvattende Googlesoektog nog nege ander variante aan die lig bring. Aangesien beskikbare korpusse te klein is of neig om alleen geredigeerde teks te bevat, kan soekenjins gebruik word om ʼn vollediger prentjie van die taalwerklikheid te probeer kry. Dit moet egter met groot omsigtigheid gedoen word, soos Fletcher (2007) waarsku: "The query, search and ranking optimization techniques [search engines] have adopted can either assist or sabotage a scholar's quest ".

    Die ander aspek wat van belang is, is dat die beginsels en metodes wat aangewend word om korpusse te ontgin, ook neergelê moet word. Dit sluit onder andere die volgende aspekte in:

    Word frekwensietellings in vergelykbare korpusse vir alle leksikale items gemaak, of net vir twyfelagtige gevalle? En hoe word nuwe leksikale items en/of patrone sistematies gevind (d.i. ten einde die insidentele opname van toevallighede, soos eendagsvlieë, teen te werk)? Die woordelys in die AWS is die organiese resultaat van meer as ʼn eeu se werk deur verskillende TK's. Aan die beginjare was korpuslinguistiese metodes nog nie beskikbaar nie, en leksikale items is slegs na die oordeel van TK-lede bygevoeg. So byvoorbeeld verskyn kernwapenbeperkingskonferensie vir die eerste keer in AWS8, waarskynlik om rekursiwiteit in komposita te illustreer. Dié woord kom egter nêrens anders as in AWS8 en AWS9 voor nie - nie in ander woordeboeke nie, en ook nie in enige korpusse of Googlesoektogte nie. Die woordelys van die AWS is nog nooit in sy geheel onderwerp aan ʼn sistematiese frekwensieondersoek nie. So ʼn ondersoek sou esoteriese gevalle soos kernwapenbeperkingskonferensie kon uitskakel.

    Hoeveel keer moet 'n leksikale item of spellingvorm voorkom alvorens dit opgeneem word? In dié verband sê Lehmann (2006): "A frequency threshold may be defined for a dictionary. Typically, hapax legomena are thrown out." Daar is tot nog toe geen vaste, formele frekwensiedrempelwaarde vir die AWS bepaal nie, omdat die AWS juis ook voorsiening maak vir hapaxlegomena wat spel- of skryfprobleme sou kon oplewer, of waarvan die status erken wil word (en omdat die korpusse waarmee gewerk word, gewoon te klein is om frekwensie as kriterium te verabsoluteer). In die samestelling van die woordelys word daar dus eerder gewerk met praktiese beduidendheid (d.i. of ʼn verskil groot genoeg is om van praktiese waarde in toegepaste omgewings te wees) as statistiese beduidendheid (d.i. wiskundige waarskynlikheid), wat dikwels bepaal word deur die vraag te beantwoord: Kom hierdie spel-/skryfvorm genoeg kere in betroubare bronne voor om erkenning daaraan te verleen? (waar beide "genoeg kere" en "betroubare bronne" relatief en subjektief is). Binne die TK is nog geen metodologiese beleid in dié verband geformaliseer nie, en dit is sonder twyfel ʼn saak wat in die toekoms verder nagevors en ondersoek moet word.

    In hierdie artikel (en in Van Huyssteen 2017) stel ek voor dat die frekwensieklas (Perkuhn et al. 2012) van ʼn bepaalde ortografiese vorm ʼn nuttige maatstaf vir opname of eliminering kan wees. Die frekwensieklas N (na onder afgerond) word bepaal deur:

    Aangesien met ortografiese vorme gewerk word, word die frekwensie van die geskrewe vorm (en nie gelemmatiseerde vorme nie) gebruik soos dit in die korpus voorkom. Dusdanig word byvoorbeeld die en Die, of soek en gesoek as aparte woord(vorm)e hanteer. Die frekwentste ortografiese vorm (die = 3 198 933 in die TK-korpus) se frekwensieklas is 0, terwyl die tweede frekwentste vorm (van = 1 393 371) in frekwensieklas 1 is. Die frekwensieklasse vertoon ʼn tipiese Zipfiaanse verspreiding, waar ʼn hapaxlegomenon soos dramakritikus in die TK-korpus in frekwensieklas 22 is. Deur sistematiese ondersoek sou die Taalkommissie ʼn drempel vir die frekwensieklas kon vasstel, byvoorbeeld dat slegs woorde in frekwensieklasse 4 tot 18 vir opname oorweeg word.

    Paradigmavoltooiing (kyk punt (6) hier bo): ʼn Spesifieke eienskap van die AWS is dat by sommige groepe leksikale items afleidings van of samestellings met die basiswoord opgeneem word ten einde die woordvormingsparadigma van die basiswoord te illustreer. Dit geld onder andere taalbenamings (byvoorbeeld Sanskrit; Sanskrities (b.nw.); Sanskritis), religieuse strominge (byvoorbeeld Hindoeïsme; Hindoe of hindoe; Hindoeïsties of hindoeïsties; Hindoekaste) en leksikale items van klassieke herkoms (byvoorbeeld reglement; reglementeer; reglementêr).

    Illustrasie: ʼn Ander AWS-spesifieke eienskap is dat leksikale items wat aan geen van bostaande kriteria voldoen nie, maar wat ter illustrasie van ʼn spesifieke spelreël ingesluit word, soms in die woordelys opgeneem word. ʼn Woord soos kelder lewer byvoorbeeld nie spellingprobleme op nie en oor die status daarvan in Standaardafrikaans bestaan geen twyfel nie, maar aangesien dit ʼn voorbeeld is by reël 11.4 (AWS11), word dit tog ingesluit in die woordelys.

    Ruimtelike beperking: Aangesien ʼn uitgewer bepaalde beperkinge op die omvang van ʼn boek kan lê (byvoorbeeld die aantal bladsye wat nie oorskry mag word nie ten einde die boek steeds teen ʼn bekostigbare prys te verkoop), moet die TK "...constantly ... make pragmatic decisions on what to include in a dictionary to conform to the dictates of space available" (Walter 1996:640). In dié verband merk Martin et al. (1983: 81-82) ook op: "The decision what to include in the dictionary still has to be made by the lexicographer himself, however, and this depends in turn upon the nature and size of the dictionary and its intended users." Sodanige besluite kan egter nie lukraak geneem word nie, maar moet liefs aan die einde van 'n hersieningsproses geskied. Hier kan allerlei outomatiese metodes gebruik word om finale keuses te maak, soos byvoorbeeld om na die gebalanseerdheid van verskillende letters te kyk (Prinsloo & De Schryver 2003), die sistematiese hantering van opgeneemde spesialisterme, paradigmas, ensovoorts.

    Die woordelysgedeelte van die AWS is sedert 2010 gratis aanlyn beskikbaar by www.woordelys.co.za. Hiermee het die AWS die digitale era betree, en ruimtelike beperkings (soos tradisioneel in ʼn boekformaat) is nie meer ʼn hoofoorweging nie. AWS11 is ook in sy geheel digitaal beskikbaar op die uitgewer se woordeboekplatform, en dié beperking word des te minder belangrik.

    4.2 Mikrostrukturele kriteria

    Mikrostrukturele oorwegings is dié wat betrekking het op/as motivering verskaf word vir die keuse en insluiting van kategorieë grammatikale inligting oor elke opgeneemde lemma. Die vraag is dus: Hoe moet die leksikale item opgeneem word?, oftewel Watter ortografiese inligting kan aan die lemmateken onttrek word? Die volgende subkriteria is onderling afhanklik, maar word tog in volgorde van belangrikheid gerangskik:

    Taalkundige korrektheid/motivering (kyk punt (1) hier bo): Myns insiens geniet die heersende konvensies van die taalsisteem en grammatika voorrang bo enige ander kriteria. Die taak van die TK is juis om te verseker dat sodanige konvensies sistematies en konsekwent toegepas word in die ortografie/skryfwyse van die taal - daarom ook dat daar altyd ervare taalkundiges en taalpraktisyns in die TK dien. Daar moet 'n passing gemaak word tussen die spelreëls onderling (d.i. reëls moet samehang toon en mekaar nie weerspreek nie) en tussen die spelreëls en die woordelys (d.i. leksikale items wat opgeneem word, moenie die spelreëls weerspreek/oortree nie). Wanneer dit uit die taalkundig wetenskaplike proses (en/of uit onderstaande kriteria) blyk dat daar 'n diskrepansie bestaan tussen die spelreëls en/of woordelys aan die een kant, en die taalwerklikheid aan die ander kant, behoort die TK te oorweeg of dit nodig is om aanpassings aan die spelreëls en/of woordelys te maak. Op dié manier beïnvloed die TK (as standaardiseringsliggaam) dus die konvensies van die taal (d.i. deur die normatiewe funksie van die TK), eerder as om uitsluitlik 'n beskrywing van taalpatrone te gee (d.i. sy deskriptiewe funksie).

    Byvoorbeeld, al kom die spelvorm *onmiddelik (en selfs *onmidellik en *onmidelik) met ʼn hoë frekwensie in korpusse voor, is dit die TK se taak om taalkundig te motiveer dat onmiddellik die korrekte spellingvorm is, aangesien dit uit die morfeme on., middel en .lik bestaan. In dié sin "troef" hierdie kriterium dus as 't ware die frekwensiekriterium (kyk hier bo).

    Ook hierdie kriterium kan egter nie verabsoluteer word nie. Dit gebeur soms dat die spelling van ʼn leksikale item die uitspraak in die volksmond navolg, ongeag die taalkundige korrektheid daarvan. Sulke uitsonderings word dan tradisioneel op ʼn ander wyse geskryf of gespel as wat deur reëls of taalkundige beginsels voorspel sou kon word. Vergelyk byvoorbeeld die woord vadoek "lap om skottelgoed mee te was/af te droog". Diachronies gesien moet die spelling vaatdoek wees, aangesien vaat die Nederlandse woord vir "skottelgoed" is. McLachlan (2016:499) toon aan dat die wisselvorme vadoek of vatdoek van AWS1 tot AWS3 erken is; van AWS4 tot AWS7 word vatdoek verander na die taalkundig meer korrekte vaatdoek (naas vadoek as wisselvorm); vanaf AWS8 word slegs vadoek erken. In beskikbare korpusse van hedendaagse Afrikaans kom vaatdoek nooit voor nie; vatdoek kom een keer voor in die TK-korpus (Taalkommissie 2011); vadoek kom 119 keer voor. Vir die hedendaagse TK om die taalkundige versene teen die talige prikkels te slaan, sou gewoon futiel wees.

    ʼn Belangrike aspek van taalkundige korrektheid het betrekking op die tradisie en ontwikkelingsgeskiedenis van die Afrikaanse ortografie waarteen "korrektheid" gestel word. Dit is ʼn feit dat daar aan die beginjare van Afrikaans se normatiewe kodifiseringsgeskiedenis sterk aangeleun is by die Nederlandse tradisie (vergelyk Van Rensburg (2017) vir ʼn oorsig en o.a. Kotzé (2014); McLachlan (2016); en Odendaal (2012) vir kritiese beskouings). By die beoordeling van ʼn bepaalde ortografiese patroon moet daar m.i. steeds heden ten dage oorweging geskenk word aan die Germaanse (spesifiek Wes-Germaanse en meer spesifiek Dietse) tradisie, omdat Afrikaans steeds vormlik binne dié taalfamilie getipologiseer kan word. As kriterium kan dit egter eweneens nie verabsoluteer word nie, omdat Afrikaans ook sedert sy vroegste ontstaansgeskiedenis ʼn eie tradisie ontwikkel het, en aangesien onder andere internasionalisering en globalisering ook bydra tot die skep van ʼn nuwe tradisie (byvoorbeeld ten aansien van transliterasie, verafrikaansing (al dan nie) van eiename, en insigte wat deur nuwe taalkundige navorsing verkry word).

    Institusionalisering (kyk punt (3) hier bo): Ten einde te bepaal tot watter mate 'n bepaalde spel- of skryfvorm reeds geïnstitusionaliseerd (algemeen gebruik en aanvaarbaar) is, en aangesien die kollektiewe insig van die taalkunde- en leksikografiegemeenskap ook besluite van die TK moet/kan rig, kan ander gesaghebbende bronne geraadpleeg word. Dit sluit onder andere omvattende woordeboeke (soos die WAT), standaardwoordeboeke (soos die HAT), vakwoordeboeke, (taalkunde)boeke, grammatikas en ander wetenskaplike publikasies in.

    Byvoorbeeld, in AWS10 word aangedui dat endomorf se meervoud óf endomorfe óf endomorwe is. In die WAT (2016) word slegs endomorfe as meervoud aangedui, en die TK het dus vir AWS11 slegs dié vorm erken en verder geïnstitusionaliseer.

    Frekwensie (kyk punt (2) hier bo): Een van die moeiliker besluite wat dikwels deur die TK geneem moet word, is of enige wisselvorme vir ʼn bepaalde spel- of skryfvorm aanvaar word. Benewens die gebruik van bogenoemde kriteria, kan die TK hom ook in dié verband deur frekwensietellings in korpusse laat lei. Soos hier bo genoem, bestaan daar in ondersoeke van hierdie aard dikwels ʼn spanning tussen statisties beduidende verskille en prakties beduidende verskille. Tot op hede maak die TK eintlik, tereg, alleen staat op prakties beduidende verskille - die enigste vraag wat beantwoord word, is of ʼn bepaalde wisselvorm met redelike frekwensie in korpusse voorkom, en of daar ʼn groot genoeg waarskynlikheid is dat die wisselvorm(e) naas ʼn ander vorm gebruik sal word. Indien wel, en indien dit ook aan van die ander kriteria voldoen (soos taalkundige korrektheid), word dit as ʼn variante lemma in die AWS opgeneem. Soos ook reeds genoem, is verdere grondige ondersoek met betrekking tot die gebruik van frekwensies en statistiek in die samestelling van ʼn woordeboek soos die AWS nodig.

    In hierdie artikel stel ek voor dat daar - veral met betrekking tot wisselvorme - gewerk word binne die statistiese raamwerk wat deur Wallis (2012a; 2012b; 2013a; 2013b) voorgehou word. Binne ʼn keusemodel word ortografiese variasie gesien as keuseopsies wat vry is om te varieer, d.i. "a genuine choice exists and all cases could theoretically be of one type or the other" (Wallis et al. 2012:4). Die waarskynlikheid P dat ʼn bepaalde vorm n1 uit die totale aantal werklike keuseopsies ni gekies sal word, is:

    Waar F(n1) die totale aantal gevalle (ongenormaliseerde frekwensie) van die eerste ortografiese variant is, F(n2) van die tweede variant, ensovoorts (Wallis et al. 2012:4). Die waarskynlikheid P word uitgedruk as ʼn waarde tussen 0 (onwaarskynlik) en 1 (volkome waarskynlik). Aangesien daar met waarskynlikhede gewerk word, kan ook met die gemiddeld van waarskynlikhede oor verskillende korpusse heen gewerk word (kyk Van Huyssteen (2016; 2017) vir ʼn toepassing van dié model).

    Om ʼn aanduiding te kry of die waarskynlikheidsverspreiding enigsins ook statisties beduidend is (indien dit nie op die oog af duidelik is nie), maak Wallis (2013a) gebruik van die enkelsteekproef-z-toets. Kortliks kom dit daarop neer dat, gegewe ʼn waargenome waarskynlikheid p en ʼn bekende, verwagte populasiewaarskynlikheid P (0,5 in die geval waar twee vorme vergelyk word), die enkelsteekproef-z-toets bepaal of die twee waardes statisties beduidend verskil. Die z-waarde word bereken deur:

    waar:

    en n die totale aantal gevalle in die steekproef is. Daarna word getoets of die absolute waarde |z| minder is as die kritieke waarde van z by ʼn bepaalde foutdrempelwaarde (0,05 in Wallis (2013a) se implementasie). Indien |z|> 1,95996 is, is die verskil in frekwensie statisties beduidend en kan die twee vorme nie eintlik as wiskundig/statisties waarskynlike wisselvorme gesien word nie. Met dié gegewens in pag, moet dan besluit word of die verskil ook prakties beduidend is.

    Byvoorbeeld, in die korpusse in VivA se korpusportaal (VivA 2016) kom weer eens 1 820 keer voor en weereens 1 199 keer. Die verskil tussen hierdie twee frekwensies is statisties beduidend (z=11,30212; p<0,00), wat beteken dat dié twee vorme eintlik nie as wisselvorme opgeneem behoort te word nie. As ʼn mens egter die waarskynlikheidsverdeling (~0,6:0,4) in ag neem, is dit tog dalk van praktiese waarde om weer eens en weereens as wisselvorme te behou. In Van Huyssteen (2017) word hierdie metode geïllustreer aan die hand van ʼn gevallestudie.

    Woordeboekstyl en redaksionele beleid: Die stylgids van ʼn woordeboek bepaal nie net wat opgeneem word nie, maar ook hoe dit opgeneem word. Oor ʼn tydperk van honderd jaar het die opnamestyl in die AWS in wese nie verander nie: ʼn Artikel bestaan uit ʼn lemma (en wisselvorme), gevolg deur fleksie-inligting, en soms word addisionele inligting (woordsoort, voorbeeld, betekenisonderskeiding of gebruiksdomein) in die vorm van woordeboeketikette aangebring. Vanaf AWS10 word sommige artikels ook van reëlverwysings voorsien. Soos in afdeling 1 aangetoon is, het die TK sedert 2006 begin om die redaksionele beleid in ʼn interne, huishoudelike stylgids te formaliseer, waarin byvoorbeeld die volgorde van etikette, die volgorde van spel- en skryfvariante en die hantering van morfologiese inligting uitgestippel word. Die voorskrifte in die stylgids is daarom bepalend vir hoe ʼn lemma uiteindelik in die AWS opgeneem word.

    Bostaande kriteria geld uiteraard nie alle gevalle nie, en kan in die praktyk nie nougeset en slaafs vir elke moontlike inskrywing gevolg word nie (gewoon omdat veral die woordelys organies oor meer as honderd jaar gegroei het). Die eksplisering hiervan dra egter hopelik by tot ʼn konsekwenter hantering van veral kontensieuse gevalle en gevalle waar keuses gemaak en besluite geneem moet word.

     

    5. SLOT

    In TABEL 2 word die opname- en elimineringskriteria prakties opgesom en geoperasionaliseer in ʼn aantal vrae. Hoe meer ja-antwoorde op die makrostrukturele vrae verkry word vir ʼn voorgestelde leksikale item, hoe groter sou die kans wees dat die leksikale item in die AWS opgeneem kan word. Die antwoorde op die mikrostrukturele vrae verskaf leiding oor hoe die inskrywing uiteindelik in die AWS daar sal uitsien. Soos telkens hier bo geargumenteer is, moet geen van die kriteria egter verabsoluteer word nie - ʼn holistiese beskouing en benadering is van kardinale belang, soos geïllustreer word in Van Huyssteen (2017).

    Deur die loop van hierdie artikel is talle temas vir verdere navorsing geïdentifiseer.

    Navorsingsvrae soos die volgende kan in die toekoms aandag geniet:

    Navorsing oor eindgebruikers:

         Wie is die primêre gebruikers van die AWS?

         Word die AWS inderdaad deur die primêre gebruikers as "dié normatiewe gesagsbron oor Afrikaanse spelling" (Carstens 2011:146) beskou?

        Wat is die voorkennis van die primêre gebruikers?

        Wat is die primêre en sekondêre behoeftes van hierdie gebruikers?

        Wat is die primêre gebruikers se toegangstrategie? Is dit hoofsaaklik die woordelys- of die spelreëlgedeelte wat eerste geraadpleeg word?

    Navorsing oor die woordelysgedeelte van die AWS:

        Hoe gebalanseerd is die AWS se lemmaverspreiding oor letters heen (Prinsloo & De Schryver 2003) in vergelyking met ander Afrikaanse woordeboeke?

        Tot watter mate is die woordelys van die AWS verteenwoordigend van hedendaagse formele, geskrewe Standaardafrikaans? Byvoorbeeld: Is daar (variante) lemmas wat slegs in die AWS voorkom en nie in werklike taalgebruiksdata of ander woordeboeke nie?

    Navorsing oor die metodologie van die TK:

        Hoe kan die TK-korpus uitgebrei en verbeter word?

        Hoe vergelyk verskeie "geslote" korpora (soos die TK- en Leipzigkorpus) met data wat deur Googlesoektogte verkry word? Kan "web hunting" (Fletcher 2005) as data-insamelingstrategie laat vaar word?

        Kan objektiewe drempelwaardes vir frekwensieklasse bepaal word om as kriterium vir opname en eliminering te dien?

        Met betrekking tot variante ortografiese vorme, is dit moontlik om objektiewe drempelwaardes vir waarskynlikheidsverspreiding daar te stel? Kan statistiese beduidendheid prakties gebruik word om die aantal wisselvorme in die AWS te beperk (of uit te brei)?

     

    ERKENNING

    Hierdie artikel is baseer op ʼn aanvanklike werksdokument wat in 2006 deur my en Tom McLachlan vir die Taalkommissie opgestel is. Erkenning word hiermee nie net gegee aan sy insette in daardie dokument nie, maar veral ook aan sy jarelange invloed op my denke oor die aard, doel en omvang van die AWS.

    Sedert 2006, toe die aanvanklike werksdokument opgestel is, het verskeie TK-lede persoonlik of tydens TK-sittings kommentaar gelewer op die dokument en bygedra tot die verfyning van die werkwyse van die TK. Erkenning word hiermee gegee aan iedere TK-lid se direkte of indirekte invloed op die vorming van die gedagtegang in hierdie artikel.

    Erkenning word ook gegee aan die volgende persone vir perspektiewe gestel in persoonlike gesprekke: Wannie Carstens, Hans du Plessis, Rufus Gouws, Danie Prinsloo en Piet Swanepoel.

    Alle potensiële denk- en argumentasiefoute bly egter myne en kan nie voor die deur van enige van hierdie individue of die TK gelê word nie.

     

    BIBLIOGRAFIE

    AWS1: Le Roux, T.H., Malherbe, D.F. & Smith, J.J., in opdrag van die Suidafrikaanse Akademie vir Taal, Lettere en Kuns. 1917. Afrikaanse woordelijs en spelreëls. 1e uitgawe. Bloemfontein: Het Volksblad-Drukkerij.         [ Links ]

    AWS2: Le Roux, T.H., Malherbe, D.F. & Smith, J.J., in opdrag van die Suidafrikaanse Akademie vir Taal, Lettere en Kuns. 1918. Afrikaanse woordelijs en spelreëls. 2e uitgawe. Bloemfontein: De Nationale Pers.         [ Links ]

    AWS3: Bosman, D.B., Le Roux, T.H., Malherbe, D.F. & Smith, J.J., in opdrag van die Suidafrikaanse Akademie vir Taal, Lettere en Kuns. 1921. Afrikaanse woordelys en spelreëls. 3e uitgawe. Bloemfontein: Die Nasionale Pers.         [ Links ]

    AWS4: Boshoff, S.P.E., Bosman, D.B., Le Roux, T.H., & Malherbe, D.F., in opdrag van die Suid-Afrikaanse Akademie vir Taal, Lettere en Kuns. 1931. Afrikaanse woordelys en spelreëls. 4e uitgawe. Bloemfontein, Kaapstad & Stellenbosch: Nasionale Pers.         [ Links ]

    AWS5: Boshoff, S.P.E.,Bosman, D.B., Hiemstra, L.W., Le Roux, T.H., & Malherbe, D.F., in opdrag van die Suid-Afrikaanse Akademie vir Taal, Lettere en Kuns. 1937. Afrikaanse woordelys en spelreëls. 5e uitgawe. Bloemfontein, Kaapstad & Pretoria: Nasionale Pers.         [ Links ]

    AWS6: Taalkommissie (samest.), in opdrag van die Suid-Afrikaanse Akademie vir Wetenskap en Kuns. 1953. Afrikaanse woordelys en spelreëls. 6e uitgawe. Kaapstad, Bloemfontein & Johannesburg: Nasionale Boekhandel.         [ Links ]

    AWS7: Taalkommissie (samest.), in opdrag van die Suid-Afrikaanse Akademie vir Wetenskap en Kuns. 1964. Afrikaanse woordelys en spelreëls. 7e uitgawe. Kaapstad & Johannesburg: Tafelberg-Uitgewers.         [ Links ]

    AWS8: Taalkommissie (samest.), in opdrag van die Suid-Afrikaanse Akademie vir Wetenskap en Kuns. 1991. Afrikaanse woordelys en spelreëls. 8e uitgawe. Kaapstad: Tafelberg.         [ Links ]

    AWS9: Taalkommissie (samest.), in opdrag van die Suid-Afrikaanse Akademie vir Wetenskap en Kuns. 2002. Afrikaanse woordelys en spelreëls. 9e uitgawe. Kaapstad: Pharos.         [ Links ]

    AWS10: Taalkommissie (samest.), in opdrag van die Suid-Afrikaanse Akademie vir Wetenskap en Kuns. 2009. Afrikaanse woordelys en spelreëls. 10e uitgawe. Kaapstad: Pharos.         [ Links ]

    AWS11: Taalkommissie (samest.), in opdrag van die Suid-Afrikaanse Akademie vir Wetenskap en Kuns. 2017. Afrikaanse woordelys en spelreëls. 11e uitgawe. Kaapstad: Pharos.         [ Links ]

    Bergenholtz, H. 1990. Lexikographische Instruktionen für ein zweisprachiges Wörterbuch. Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung, 43:19-37.         [ Links ]

    Carstens, W.A.M. 2011. Norme vir Afrikaans. 5e uitgawe. Pretoria: J.L. van Schaik.         [ Links ]

    De Schryver, G-M. & Prinsloo. D.J. 2001. Corpus-based activities versus intuition-based compilations by lexicographers: The Sepedi lemma-sign list as a case in point. Nordic Journal of African StudiesI, 10(3):374-398.         [ Links ]

    De Villiers, M. 1977. Die plek van die normatiewe in die taalkunde. Taalfasette, 22(3):1-9.         [ Links ]

    Fletcher, W.H. 2007. Concordancing the web. Promise and problems, tools and techniques. In Hundt, M., Nesselhauf, N. & Biewer, C. (eds). Corpus Linguistics and the Web. Amsterdam: Rodopi, pp.1-22.         [ Links ]

    Fuertes-Olivera, P.A. 2012. Lexicography and the internet as a (re-)source. Lexicographica, 28:49-70.         [ Links ]

    Gouws, R.H. 1989. Leksikografie. Pretoria: Academica.         [ Links ]

    Gouws, R.H. & Prinsloo, D.J. 2005. Principles and practice of South African lexicography. Stellenbosch: SUN PRESS.         [ Links ]

    Gove, P.B. (ed.). 1961. Webster's Third New International Dictionary of the English Language. Springfield: Merriam-Webster.         [ Links ]

    HAT6: Luther, J., Pheiffer, F. & Gouws, R.H. (reds.). 2015. Handwoordeboek van die Afrikaanse taal. 6e uitgawe. Kaapstad: Pearson. (In VivA Woordeboekportaal. Weergawe 1.2. [Toepassing]). https://www.microsoft.com/en-gb/store/apps/windows [30 November 2016]

    Heid, U., Evert, S., Säuberlich, B., Debus-Gregor, E. & Scholze-Stubenrecht, W. 2004. Tools for upgrading printed dictionaries by means of corpus-based lexical acquisition. Proceedings of the 2004 Language Resources and Evaluation Conference. Lisbon: LREC, pp. 419-423.         [ Links ]

    Instituut voor Nederlandse Lexicologie. 2005. Het Groene Boekje: Woordenlijst Nederlandse Taal van de Nederlandse Taalunie. Den Haag: Sdu Uitgevers.         [ Links ]

    Kotzé, E.F. 2014. Afrikaans as besitting, en die vraagstuk van herstandaardisering. Tydskrif vir Geesteswetenskappe, 54(4):635-655.         [ Links ]

    Lehmann, C. 2006. Daten - Korpora - Dokumentation. In Institut für Deutsche Sprache - Jahrbuch 2006. Sprachkorpora - Datenmengen und Erkenntnisfortschritt. Berlin: De Gruyter, pp. 9-27.         [ Links ]

    Martin, W.J.R., Al, B.P.F. & Van Sterkenburg, P.J.G. 1983. On the processing of a text corpus: From textual data to lexicographical information. In Hartmann, R.R.K. (ed.). Lexicography: Principles and practice (Applied language studies 5). London: Academic Press, pp. 77-87.         [ Links ]

    McLachlan, J.D. 2016. Standaardafrikaans, standaardspelling en die AWS. Tydskrif vir Geesteswetenskappe, 56(2-1):477-502.         [ Links ]

    Nederland. 2005. Spellingwet van 15 September 2005.         [ Links ]

    Odendaal, B.G. 2012. Die herstandaardisering van Afrikaans: ʼn Praktiese benadering met die AWS as gevallestudie. Ongepubliseerde proefskrif. Stellenbosch: Universiteit Stellenbosch.         [ Links ]

    Perkuhn, R., Keibel, H. & Kupietz, M. 2012. Korpuslinguistik. Paderborn: Wilhelm Fink Verlag.         [ Links ]

    Prinsloo. D.J. & De Schryver, G-M. 2003. Effektiewe vodering met die 'Woordeboek van die Afrikaanse Taal' soos gemeet in terme van 'n multidimensionele liniaal. In Botha, W. (red.). 'n Man wat beur: Huldigingsbundel vir Dirk van Schalkwyk. Stellenbosch: Buro van die WAT, pp. 106-126.         [ Links ]

    Projekt Deutscher Wortschatz. 2016. Afrikaans corpus. Leipzig: Universität Leipzig, Abteilung Automatische Sprachverarbeitung. http://corpora.uni-leipzig.de/en        [ Links ]

    Reynaert, M. 2009. Parallel identification of the spelling variants in corpora. Proceedings of the Third Workshop on Analytics for Noisy Unstructured Text Data. Barcelona, pp. 77-84.         [ Links ]

    Singh, R.A. 1982. An Introduction to Lexicography. Michigan: University of Michigan, Central Institute of Indian Languages. http://www.ciil-ebooks.net/html/lexico/link5.htm [2 Desember 2016].         [ Links ]

    Suid-Afrika. 1959. Wet op die Suid-Afrikaanse Akademie vir Wetenskap en Kuns 54 van 1959.         [ Links ]

    Suid-Afrikaanse Akademie vir Wetenskap en Kuns. 2015. Reglement: Taalkommissie. Hersiene weergawe goedgekeur in September. Pretoria: Suid-Afrikaanse Akademie vir Wetenskap en Kuns.         [ Links ]

    Taalkommissie van die Suid-Afrikaanse Akademie vir Wetenskap en Kuns. 2011. Taalkommissiekorpus 1.1. Potchefstroom: CTexT, Noordwes-Universiteit.         [ Links ]

    Tarp, S. & Fuertes-Olivera, P.A. 2016. Advantages and disadvantages in the use of internet as a corpus: The case of the online dictionaries of Spanish Valladolid-UVa. Lexikos, 26:273-295.         [ Links ]

    Tomaszczyk, J. 1983. On bilingual dictionaries: The case for bilingual dictionaries for foreign language learners. In: Hartmann, R.R.K. (ed.). Lexicography: Principles and practice (Applied language studies 5). London: Academic Press, pp. 41-51.         [ Links ]

    Van Huyssteen, G.B. 2016. Die ortografiese realisering van komposita met en afleidings van multiwoordeiename. LitNet Akademies, 13(3):424-456.         [ Links ]

    Van Huyssteen, G.B. 2017. Opname- en elimineringskriteria vir die Afrikaanse Woordelys en Spelreëls: Die geval emeritus. Tydskrif vir Geesteswetenskappe, 57(2-1):346-368.         [ Links ]

    Van Rensburg, M.C.J. 2017. Ná honderd jaar: die Afrikaans van die eerste taalkommissie. Tydskrif vir Geesteswetenskappe, 57(2-1):249-270.         [ Links ]

    Van Sterkenburg, P.J.G. 2004. Resensie: Afrikaanse Woordelys en Spelreëls. Lexikos, 14:428-431.         [ Links ]

    Virtuele Instituut vir Afrikaans (VivA). 2016. Korpusportaal. http://viva-afrikaans.org [20 November 2016].         [ Links ]

    Wallis, S. 2012a. Measures of association for contingency tables.http://www.ucl.ac.uk/english-usage/staff/sean/resources/phimeasures.pdf%5Cnhttps://corplingstats.wordpress.com/2012/04/09/measures-of-association/ [2 Desember2016].         [ Links ]

    Wallis, S. 2012b. Robust and sound? https://corplingstats.wordpress.com/2012/04/04/robust-and-sound/. [2 Desember 2016].         [ Links ]

    Wallis, S. 2013a. Comparing frequencies within a discrete distribution. https://corplingstats.wordpress.com/2013/05/20/comparing-frequencies/ [2 Desember 2016].         [ Links ]

    Wallis, S. 2013b. Goodness of fit measures for discrete categorical data.http://www.ucl.ac.uk/english-usage/staff/sean/resources/gofmeasures.pdf. [2 Desember 2016].         [ Links ]

    Wallis, S., Bowie, J. & Aarts, B. 2012. That vexed problem of choice. Some reflections on experimental design and statistics with corpora. In International Conference on Advances in Mechanics Engineering (ICAME 33), Leuven. http://www.ucl.ac.uk/english-usage/staff/sean/resources/vexedchoice.pdf. [6 Julie 2016].         [ Links ]

    Walter, E. 1996. Parallel development of monolingual and bilingual dictionaries for learners of English. In Gellerstam, M., Järborg, J., Malmgren, S-G., Norén, K., Rogström, L. & Papmehl, C.R. (eds). Euralex '96 Proceedings I-II.Gothenburg: Göteborg University, Department of Swedish, pp. 635-641.         [ Links ]

    WAT: Woordeboek van die Afrikaanse Taal. 2016. Stellenbosch: Buro van die WAT. (In VivA Woordeboekportaal. Weergawe 1.2. [Toepassing]). https://www.microsoft.com/en-gb/store/apps/windows [30 November 2016].         [ Links ]

    Wette kyk Suid-Afrika.

    Zgusta, L. 1971. Manual of lexicography.The Hague: Mouton.         [ Links ]

     

     

     

    GERHARD VAN HUYSSTEEN is professor in Afrikaanse taalkunde en taaltegnologie aan die Noordwes-Universiteit. Hy dien sedert 2005 op die Taalkommissie van die Suid-Afrikaanse Akademie vir Wetenskap en Kuns en is tans voorsitter van dié liggaam. Vanaf 2009-2014 dien hy ook op die paneel van mensetaaltegnologiekundiges van die Departement Kuns en Kultuur. Hy is onder andere ontvanger van die Elizabeth Eybers-beurs, die CL Engelbrecht-prys vir taalkundenavorsing vir sy aandeel in die publikasie van die Afrikaanse Woordelys en Spelreëls, en die Stalsprys vir multi- en interdissiplinêre spanwerk. Hy het al verskeie grootskaalse, internasionale multimiljoenrandprojekte gelei, waaronder projekte vir Microsoft, MTN en die Suid-Afrikaanse regering. Van Huyssteen is veral bekend vir sy bydrae as taalkundige in die ontwikkeling van tekstegnologietoepassings en verskeie elektroniese hulpbronne vir Afrikaans, asook as konseptualiseerder, samesteller en beoordelaar van die kykNET-program Op die Spel.
    GERHARD VAN HUYSSTEEN is professor in Afrikaans linguistics and language technology at the North-West University. Since 2005, he served in the "Taalkommissie" (Language Commission) of the "Suid-Afrikaanse Akademie vir Wetenskap en Kuns" (South African Academy for Science and Arts), and is currently chair of this commission. He has also served in the Human Language Technology Expert Panel of the Department of Arts and Culture from 2009-2014. He is the recipient of, among others, the Elizabeth Eybers Bursary, CL Engelbrecht Award for linguistic research for his contribution to the publication of the Afrikaanse Woordelys en Spelreëls, and the Stals Award for multi- and interdisciplinary team work. He has initiated and led numerous large-scale, international, multimillion rand projects for institutions like Microsoft, MTN and the South African government. Van Huyssteen is known for his contribution as a linguist in the development of text technology applications and various resources for Afrikaans, as well as conceptualiser and developer of the kykNET programme Op die Spel.