Top Banner
ISSN 1392-0588 DARBAI ir DIENOS 2000.24 KALBOTYRA INFORMACINEI VISUOMENEI Rßta MARCINKEVI¨IEN¸ 1. `VADAS Paskutinieji XX a. deðimtmeLiai pasiþy- mºjo itin sparLia informacinil techno lo- gijl raida, padariusia perversmà moks le ir kasdieniame gyvenime. Neaplenkº ji ir daugiau nei du tßkstanLius metl tu- rinLio mokslo kalbotyros. Iðtobulºjæ kompiuteriai leido sukaupti didelius teks- tl kiekius ir taikyti jl ana lizei naujus metodus. Palaipsniui kiekybº virto ko- kybe ºmº rastis nauja paradigma, lei- dþianti visai kitaip paþvelgti Æ kalbà, lai- komà viena ið bßdingiausil þmogaus ypa- tybil, paLia þmogiðkumo esme. Viena tos paradigmos dali l tekstynl lingvis- tika, tik keli l deðimLil metl senumo ka l- bos tyrimo sritis, ir yra ðio darbo tema. Norint suprasti tekstynl lingvistikos (toliau TL) savitumà, reikia iðmanyti jos tyrimo objektà tekstynus, jl sàran- gos principus ir tipus, analizºs priemo- nes ir bßdus. Tad Lia ir bus kalbama apie kompiuterinius tekstynus ir jl tyrimams bßtinà programinæ Ærangà. Atskirai bus aptariami ið tekstynl gauti produktai daþniniai sàraðai ir konkordansai bei jl tyrimo ypatumai, iliustruojami daikta- vardþio apatija analize. Kad iðryðkºt l TL naujumas ir vieta kitl moks l l bendrijo- je, bus kalbama apie TL statusà, jos slinktÆ nuo metodologijos link teorijos, sàlytÆ ir prieðtarà kitoms kalbos moksl l teorijoms, TL postuluojamas savàsias teorines nuo- statas, jos naudà kitoms humanitarinil ir tiksli ljl moks l l ðakoms bei informa- cinil techno logij l praktikai. Ga liausiai bus aptarta TL svarba visuomenei XXI a. informacinei visuomenei. 1.1. KAS YRA TEKSTYNAS Anglosaksiðkuose kraðtuose dabar labai madinga kone viskà, kas prieð keletà met l buvo laikoma duomenimis, vadinti teks- tynu ( corpus ). Bet koks, kad ir pats ma- þiausias, elektroninæ formà turinLi l tekstl rinkinys yra tekstynas. Ið tiesl tekstynu, anot Johno Sinclairio, vadintinas tik ...toks tekstl rinkinys, kuris yra pakan- kamai didelis, matuojant pagal ði l die- nl kompiuterinil techno logij l ga limy- bes, ir sudarytas ne dºl kokio specialaus tyrimo, bet nepriklausomai nuo jo pa- naudojimo tiksl l(Sinc lair 1999a:33) 1 . To- ny McEnery nurodo net tris ðio þodþio reikðmes. Pati bendriausia reikðmº yra bet koks tekstl rinkinys, daþniausia elektronini l tekstl rinkinys, o grieþ- Liausia, terminologiðkiausia baigtinis elektronini l tekstl rinkinys, sudarytas taip, kad kuo geriau atspindºtl ka lbà ar jos atmainà (McEnery et al. 1996:177). Taigi dydis ir bendras pobßdis arba re- prezentatyvumas, be savaime supranta- mos ðioms dienoms elektroninºs formos, yra nurodomi kaip pagrindiniai teksty- no bruoþai. TaLiau Æsigilinus Æ tekstyn l tipus, paaiðkºja kur kas didesnº ir prieð- Tekstynl lingvistika TEORIJA IR PRAKTIKA
58

Marcinkeviciene R. Tekstynu Lingvistika

Oct 28, 2014

Download

Documents

Julija Budnik
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Marcinkeviciene R. Tekstynu Lingvistika

ISSN 1392-0588DARBAI ir DIENOS2000.24

KALBOTYRAINFORMACINEI

VISUOMENEI

Rûta MARCINKEVIÈIENË

1. ÁVADAS

Paskutinieji XX a. deðimtmeèiai pasiþy-mëjo itin sparèia informaciniø technolo-gijø raida, padariusia perversmà moksleir kasdieniame gyvenime. Neaplenkë jiir daugiau nei du tûkstanèius metø tu-rinèio mokslo � kalbotyros. Iðtobulëjækompiuteriai leido sukaupti didelius teks-tø kiekius ir taikyti jø analizei naujusmetodus. Palaipsniui kiekybë virto ko-kybe � ëmë rastis nauja paradigma, lei-dþianti visai kitaip paþvelgti á kalbà, lai-komà viena ið bûdingiausiø þmogaus ypa-tybiø, paèia þmogiðkumo esme. Vienatos paradigmos daliø � tekstynø lingvis-tika, tik keliø deðimèiø metø senumo kal-bos tyrimo sritis, � ir yra ðio darbo tema.Norint suprasti tekstynø lingvistikos

(toliau � TL) savitumà, reikia iðmanytijos tyrimo objektà � tekstynus, jø sàran-gos principus ir tipus, analizës priemo-nes ir bûdus. Tad èia ir bus kalbama apiekompiuterinius tekstynus ir jø tyrimamsbûtinà programinæ árangà. Atskirai busaptariami ið tekstynø gauti produktai �daþniniai sàraðai ir konkordansai bei jøtyrimo ypatumai, iliustruojami daikta-vardþio apatija analize. Kad iðryðkëtø TLnaujumas ir vieta kitø mokslø bendrijo-je, bus kalbama apie TL statusà, jos slinktánuo metodologijos link teorijos, sàlytá irprieðtarà kitoms kalbos mokslø teorijoms,TL postuluojamas savàsias teorines nuo-statas, jos naudà kitoms humanitariniø

ir tiksliøjø mokslø ðakoms bei informa-ciniø technologijø praktikai. Galiausiaibus aptarta TL svarba visuomenei � XXIa.informacinei visuomenei.

1.1. KAS YRA TEKSTYNAS

Anglosaksiðkuose kraðtuose dabar labaimadinga kone viskà, kas prieð keletà metøbuvo laikoma duomenimis, vadinti teks-tynu (corpus). Bet koks, kad ir pats ma-þiausias, elektroninæ formà turinèiø tekstørinkinys yra tekstynas. Ið tiesø tekstynu,anot Johno Sinclairio, vadintinas tik�...toks tekstø rinkinys, kuris yra pakan-kamai didelis, matuojant pagal ðiø die-nø kompiuteriniø technologijø galimy-bes, ir sudarytas ne dël kokio specialaustyrimo, bet nepriklausomai nuo jo pa-naudojimo tikslø�(Sinclair 1999a:33)1. To-ny McEnery nurodo net tris ðio þodþioreikðmes. Pati bendriausia reikðmë yra�bet koks tekstø rinkinys�, daþniausia ��elektroniniø tekstø rinkinys�, o grieþ-èiausia, terminologiðkiausia � �baigtiniselektroniniø tekstø rinkinys, sudarytastaip, kad kuo geriau atspindëtø kalbà arjos atmainà� (McEnery et al. 1996:177).Taigi dydis ir bendras pobûdis arba re-prezentatyvumas, be savaime supranta-mos ðioms dienoms elektroninës formos,yra nurodomi kaip pagrindiniai teksty-no bruoþai. Taèiau ásigilinus á tekstynøtipus, paaiðkëja kur kas didesnë ir prieð-

Tekstynø lingvistikaTEORIJA IR PRAKTIKA

Page 2: Marcinkeviciene R. Tekstynu Lingvistika

8 KALBOTYRA INFORMACINEI VISUOMENEI

taringesnë tekstyno poþymiø ávairovë,jø painiojimas su dideliais tekstø archy-vais ar tekstinëmis duomenø bazëmis(Kennedy 1998:3). Tad parankiausia bû-tø tekstynà apibûdinti lyginant já su tekstubei klasifikuojant pagal tipus.Kas gi sieja tekstynà su tekstu ir skiria

já nuo teksto? Bendra jiems yra tik tai,kad tekstynas sudarytas ið tekstø. Teksty-no ir ilgo teksto apimtys gali sutapti, tadne dydis svarbu. Svarbi yra skirtinga tekstoir tekstyno struktûra. Tekstà prasmingaanalizuoti visà iðtisai, jis turi struktûrà:pradþià, vidurá ir pabaigà, yra daugiauar maþiau riðlus ir vientisas, tà galimaapèiuopti ir iðtirti. Tekstynas kaip tekstørinkinys jau reikalauja visai kitokios tyri-mo metodikos, tekstyno niekas iðtisai ne-skaito ir taip nuodugniai kaip teksto ne-tyrinëja. Tekstynas neturi struktûros, tiksandarà, jo pradþia ar pabaiga yra dirbti-nës, nesvarbu, kur koká tekstà dësi. Teks-tyno esmë ta, kad jo neverta ir neámano-ma tirti tiesiogiai, skaityti taip, kaip teks-to, o tik su programinëmis priemonëmis,ávairiais árankiais (þr. 1.3.) Taigi esminëteksto ir tekstyno skirtybë ne sandara, nekalbø kiekis, net ne dydis ar reprezenta-tyvumas, bet su kompiliacine tekstyno pri-gimtimi susijusi jo tyrimo metodologija(Sinclair 2000a, Bonelli 2000). Ja ir derëtøpapildyti apibrëþimà tekstyno, supranta-mo kaip didelio reprezentatyviø elektro-niniø tekstø rinkinio, naudojamo su spe-cialia programine áranga.Apþvelgti konkreèius tekstynus ðian-

dien tikrai sunku, nes jø esama daug irávairiø. Tekstynø lingvistikos vadovëliuo-se jie pateikiami jau iðtisomis kartomis(Kennedy 1998:23�57). Komerciniai teks-tynai, jø analizës árankiai bei naujausiinternetiniai kalbos iðtekliai (tekstynai,archyvai, leksikonai, duomenø bazës irprograminë áranga) yra iðvardyti ir ano-tuoti Douglaso Biberio ir kitø (Biber etal. 1998:281�287). Be abejo, tobulëjanttechnologijoms, tekstynai randasi ir kei-

èiasi greitai ir smarkiai, todël kur kasprasmingiau tekstynus aptarti ne indivi-dualiai, bet pagal jø tipus.

1.2. TEKSTYNØ TIPAI

Tekstynø ðiandien esama daug ir ávai-riø. Kad ir kokie ávairûs jie bûtø, pir-miausia skirtini á dvi grupes pagal tai, arkonkreti jø rûðis laikoma tinkama, ar ne.Kitaip sakant, yra tokiø tekstynø tipø,dël kuriø tinkamumo ar netinkamumonesibaigia diskusijos. Karðtai ginèijama-si dël tekstyno dydþio, bûtinybës nuolatjá papildyti bei anotuoti, ypaè dël repre-zentatyvumo, svarstoma, kurie tekstynaigeresni: maþi ar dideli, baigtiniai ar tæs-tiniai, koduoti, anotuoti ar ðvarûs, gry-ni, reprezentatyvûs ar oportunistiniai. Dëlkitokiø tekstynø tipø diskusijø nekyla,nors ir labai besiskiriantys savo pobû-dþiu, reikalingi ir vieni, ir kiti, nelygudarbo tikslai ir objektas. Tokie yra ben-drojo pobûdþio ir specialieji, sakytinësir raðytinës kalbos, vienakalbiai ir para-lelûs bei palyginamieji, senøjø raðtø irdabartinës kalbos tekstynai. Èia jie ir busaptarti problemiðkumo tvarka.Pirmieji tekstynai, atsiradæ septintaja-

me deðimtmetyje, buvo ið ðiandieniniøpozicijø þiûrint labai nedideli � vos vie-no milijono þodþiø apimties2. Ðiandienkai kurie tekstynai jau artëja prie pusësbilijono ribos, ir èia ne pabaiga, nes, at-siradus internetui, tekstynø augimo tem-pai pasidarë kur kas spartesni. Visai ne-sunku atskiriems individams su pakan-kamai galingu personaliniu kompiute-riu sukaupti áspûdingà tekstø kieká. Ne-sunku, bet ar verta? Taigi kokie teksty-nai geresni � maþi ar dideli?Kai kurie tekstynai yra maþi ið prigim-

ties, pvz., senøjø raðtø, taip pat mirusiøkalbø raðto paminklø, atskirø autoriø �W.Shakespearo ar net atskirø kûriniø,tarkim, Ðventojo Raðto. Jø nepadidinsi,

Page 3: Marcinkeviciene R. Tekstynu Lingvistika

9Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

jie ir liks ribotos apimties, bet kai kalba-ma, kad ir kitiems, ðiandieninës kalbostekstynams, pakanka apimties, kad juo-se yra visa reikiama informacija, � taijau nebegerai, mano J.Sinclairis. Anot jo,maþumas � ne dorybë, o ribotumas, nesmaþi tekstynai nëra tokie patys kaip irdideli, tik kitos apimties (Sinclair 2000a).Tekstyno tekstø kiekis lemia ne tik jokiekybæ, bet ir kokybæ. Vieno milijonoþodþiø apimties tekstyne nuo 40 iki 50procentø þodþiø formø pasirodo tik vie-nà kartà, o polisemiðkø þodþiø yra pa-vartota tik pusë reikðmiø. Tuo tarpu betkuriam kalbos vienetui apraðyti reikiamaþiausiai dviejø jo pavartojimo atvejø,tad analizei lieka tik pusë tekstyno. Okiek kartø þodis turi bûti pavartotas, kadiðryðkëtø jo kolokaciniai modeliai, reikð-miø vartosenos ypatumai, morfologinëscharakteristikos. Todël maþi ar sàlygiðkaimaþi tekstynai naudojami daþniems, pa-prastai gramatiniams, vienetams tirti. Lek-sikai tirti, juolab leksikografijai, reikiadi-deliø tekstynø (Biber et al. 1998:22�23).Jei kam yra tekæ tirti tà patá leksiná

vienetà dideliame ir þymiai maþesniametekstyne, tas þino dar vienà didelio teks-tyno privalumà: jame iðryðkëja dësnin-gumø, kuriø nematyti maþame. Angløkalbos daiktavardþio mind analizë paro-dë, kad maþame tekstyne aptinkami ko-ne visi svarbiausi þodþio vartosenos mo-deliai, taèiau jame aiðki tik ávairovë, pa-vieniai ar jau bent negausûs jø pasireið-kimo bûdai. Atskirø modeliø vartosenosdaþnumas, taigi ir bendrosios tendenci-jos, iðryðkëja tik ið didelio tekstyno (Mar-cinkevièienë 2000a).Dideli tekstynai turi ne tik privalumø,

bet ir trûkumø. Jie yra priklausomi nuokompiuteriø galingumo ir programø ko-kybës. O nuo tekstyno dydþio priklausoir tekstø apdorojimo laikas, ir kiti su tech-nologijomis susijæ dalykai (plaèiau apiedarbo su tekstynais keblumus þr. Facci-netti 1998). Net ir palyginti greitai ir sëk-

mingai gavus ið didelio tekstyno reikia-mà informacijà, po to bûna labai sunkususidoroti su sunkiai aprëpiama jos ap-imtimi. Graeme Kennedy raðo, jog 1000konkordanso eiluèiø yra riba, kurios ne-gali perþengti leksikografas, jei nori ap-rëpti, atsiminti ir sutvarkyti vienos lek-semos vartosenos atvejus. Daroma iðva-da, jog nëra prasmës didinti tekstyno,jei tampa neámanoma dirbti su jo duo-menimis (Kennedy 1998:67�68).G.Kennedy nuomonë visai prieðinga

J.Sinclairio, kuriam net 10�20 milijonøþodþiø apimties tekstø rinkinys gali bûtinaudingas tik kaip maþas bendrojo tipotekstynas, bet jis bus tikrai nepakanka-mas kalbos visumai apraðyti (Sinclair2000a). G. Kennedy savo ruoþtu teigia:Milþiniðkas tekstynas nebûtinai atspindi irreprezentuoja kalbà ar kurià nors jos atmai-nà geriau nei maþas tekstynas. Ðioje teksty-nø raidos pakopoje mes tiesiog neþinome,kokio dydþio turi bûti tekstynas, kad jis ten-kintø bendro pobûdþio ar specialius tikslus.Todël uþuot akcentavus tekstyno dydá, teks-tynø sudarytojai ir tyrëjai verèiau atsiþvelg-tø á tekstyno kokybæ, kuri yra lygiai taip patsvarbi (Kennedy 1998:67�68).

Neneigiant tekstyno kokybës, t.y. jotekstø ávairovës ir reprezentatyvumo svar-bos, galima pasakyti, kad ið dviejø kruopð-èiai sudarytø tekstynø didesnis visadabus geresnis, nes tik jis parodys tipiðkànet ir reèiau vartojamø kalbos vienetøvartosenà. O susitvarkyti su dideliais tu-rimø duomenø kiekiais gali padëti gerasjø statistinës atrankos principas ar spe-ciali programinë áranga, pvz., leidþiantileksikografui manipuliuoti konkordan-so eilutëmis. Þodyno rengimo automati-zavimas, prasidëjæs nuo elektroninio teks-tyno, turëtø bûti tæsiamas per visus dar-bo etapus: duomenø atrankà, jø analizæbei tos analizës rezultatus, saugomus tamskirtose duomenø bazëse.Kita iðeitis bûtø turëti keliø dydþiø ir

keliø tipø tekstynus: maþiausià apie 1milijono þodþiø, gramatiðkai anotuotà,

Page 4: Marcinkeviciene R. Tekstynu Lingvistika

1 0 KALBOTYRA INFORMACINEI VISUOMENEI

skirtà gramatinei ir kitokiai (pvz., daþ-nai vartojamø leksemø) analizei, kuriainereikia daug leksiniø vienetø, jis galibûti ir ne iðtisø tekstø, bet imèiø. Dides-nis, apie 10 milijonø þodþiø apimties,tekstynas, minimaliai koduotas, su pre-ciziðkai atrinktais tekstais, galëtø tiktidaugialypei analizei ir kalbos vienetø pa-ieðkai, kuriai ne tiek svarbus bendras kal-bos vaizdas, kiek atskirø jos vienetø var-tosenos ypatumai. Toliau eitø labai di-delis, apie 100 milijonø ir daugiau þo-dþiø, tekstynas, vartojamas tuomet, kaireikia patikimos statistikos, kolokaciniøir gramatiniø vartosenos modeliø, iðryð-këjanèiø tik ið didelio pavartojimo kie-kio ir retø leksiniø vienetø. Galiausiaidar galima turëti netvarkytø tekstø ar-chyvà, ið kurio pagal poreikius á visuskitus tekstynus keliami jau sutvarkyti pa-gal bendrus principus tekstai. Galima tiksutikti su G.Kenndy, kad tekstyno dydábûtina derinti su jo ðaltiniø ávairove, oðiaip jau tekstyno dydis turi bûti adek-vatus naudojimosi juo tikslui (Kenndy1998:68).Su tekstyno dydþiu siejasi jo tæstinu-

mas, dar kitaip vadinamas dinamiðku-mu. Pagal ðá poþymá skiriami baigtiniaiir tæstiniai ar statiniai ir dinaminiai teks-tynai (Kennedy�s dynamic vs. Sinclair�smonitor corpora). Baigtiniai ar statiniai teks-tynai kaip momentinës fotografijos pa-rodo kalbos vaizdà tam tikru metu. Jiegali bûti pravartûs, kai yra lyginami supanaðiais, tik kitu laiku ar kitai kalbai,dialektui, kalbos atmainai sukonstruo-tais tekstynais. Statiðki gali bûti tiek ma-þi, tiek dideli tekstynai. Tæstiniai, nuolatslenkantys ir besikeièiantys tekstynai taippat gali bûti ávairaus dydþio, nors pa-prastai esti dideli. Juose átaisyti filtraileidþia ið didelio naujø tekstø kiekio at-sirinkti tik naujus kalbos faktus. Tæsti-niai tekstynai paprastai bûna iðtisø teks-tø, o ne tekstiniø imèiø, dël to daþnainëra subalansuoti. Anot J.Sinclairio, ðiø

tekstynø dydis atstoja imèiø tekstyno su-balansuotumà kaip svarbiausià tekstynosandaros principà, didelis tekstø kiekissavaime sudaro sàlygas didesnei kalbosvienetø vartojimo ávairovei (Sinclair1991:61). Toks tekstynø sudarymo bû-das per brangus individams ar akademi-nëms institucijoms, tæstinius tekstynusgali rengti tik turtingos firmos ar didelikonsorciumai. Tæstiniai megabaitinës ap-imties tekstynai ypaè vertingi leksikogra-fams ir kalbos raidos tyrinëtojams.Nuo pat tekstynø atsiradimo buvo sie-

kiama rengti juos subalansuotus, suda-rytus ið ávairiø ðaltiniø pagal aiðkius at-rankos principus, kad tekstyne lyg veid-rodyje atsispindëtø kalba ar maþesnë josdalis (Atkins et al. 1992, Sinclair 1991:13�20, McEnery et al. 1996:21�24). Tik vë-liau, atsiradus dideliems kompiuteriniøtekstø kiekiams, paplito tokie tekstynai,á kuriuos buvo dedami visi gauti, dëlautoriniø teisiø ar kokiø kitø prieþasèiølengviau prieinami tekstai. Taip atsira-do oportunistiniø ir balansuotø-repre-zentatyviø tekstynø prieðprieða, kuriospageidautinas narys yra reprezentatyvustekstynas.Teoriniø pasvarstymø apie tekstynø

reprezentatyvumà esama ávairiø (Biber1993, Èermák1995, Kennedy 1998:62�66ið daugelio kitø). Ðalia tekstyno ðaltiniøávairovës ir tekstø balanso jis minimastodël, kad balansas pasiekiamas ne ly-giomis dalimis ið ávairiø ðaltiniø imanttekstus, pvz., sakytinius ir raðytinius, betnustatant jø proporcijas pagal esminiuskriterijus. O tø kriterijø taip pat esamapaèiø ávairiausiø. Della Summers, duo-dama ávairiø atrankos principø ir krite-rijø apþvalgà, nurodo tokius kaip: elitið-kumas, kai pagal literatûrinius ar akade-minius kriterijus atrenkami vertingiausiir átakingiausi tekstai, skaitomumas, dëlkurio tekstynuose dominuoja publicisti-ka ir bestseleriai, demografiniai rodikliai,pagal kuriuos siekiama kuo didesnës de-

Page 5: Marcinkeviciene R. Tekstynu Lingvistika

1 1Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

mografinës tekstø autoriø ávairovës, pri-einamumas � galimybë lengvai gauti teks-tus, ávairios lingvistinës specifikacijos, to-kios kaip tekstø tipai, þanrai, stiliai irpan. Èia priklauso ir subjektyvûs tekstynorengëjø sprendimai apie tekstø tipiðkumà, at-sitiktinës atrankos principas, o galiausiaivisø ðiø kriterijø derinys, paprastai va-dinamas pragmatiniu sprendimu (Summers1991, cituota ið Kennedy 1996:63�64).Kalbant apie reprezentatyvumà, pir-

miausia kyla klausimas, kà turi atspin-dëti tekstynas. Labai bendras ir abstrak-tus pasakymas, kad jis turi atspindëtikalbà ar jos ávairovæ, yra visai neinfor-matyvus. Kalba yra tokia sudëtinga irdaugialypë, sudaryta ið tokios didelësatmainø ávairovës, kad, norint jà atspin-dëti, reikia suskaidyti á sudedamàsias da-lis ir kalbëti konkreèiau. Vienas ið bûdøtà padaryti yra apimti visus keturias kal-bos vartojimo sritis: aktyviàjà, t.y. josprodukavimà � kalbëjimà ir raðymà, irpasyviàjà � klausymà ir skaitymà. Be to,dar kalba skiriasi pagal bet kurios ið nu-rodytøjø srièiø vartotojø kieká. Ðis ro-diklis taip pat yra svarbus, nes tekstyneturëtø bûti kuo platesniu mastu vartoja-ma kalba, idealiu atveju � ne vieno raðy-tojo ar kalbëtojo, skirta vienam skaityto-jui ar klausytojui, bet daugelio raðytojødaugeliui skaitytojø skirti tekstai.Atsiþvelgdamas á kalbos siuntëjø ir pri-

ëmëjø kiekybiná santyká, Frantiðekas Èer-mákas siûlo skirti aðtuonias kalbos var-tojimo galimybes, kai, þvelgiant ið akty-vios kalbos vartosenos pozicijø, a) dau-gelis raðytojø raðo daugeliui skaitytojø,b) daugelis raðytojø raðo keletui skaity-tojø, c) keli raðytojai raðo daugeliui skai-tytojø, d) keli raðytojai raðo keliems skai-tytojams. Þvelgiant ið pasyvios kalbosvartosenos pozicijø, taip pat galima nu-rodyti keturias galimybes, kai e) daugskaitytojø skaito tekstus, paraðytus dau-gelio raðytojø, f) daug skaitytojø skaitotekstus, paraðytus keleto raðytojø, g) ma-

þai skaitytojø skaito tekstus, paraðytusdaugelio, arba h) keliø raðytojø (Èermák1997:192).Taigi esminis kriterijus, F.Èermáko nuo-

mone, yra paremtas aktyviàja ir pasy-viàja kalbos vartosena. Atitinkamomis jøproporcijomis remiantis ir yra sudarytidanø ir èekø kalbø tekstynai. Èia bûtinapridurti, kad nors teorinëje literatûrojeir nurodama daug tekstø atrankos krite-rijø bei tekstyno sudarymo principø, ta-èiau praktikoje daugelis reprezentatyviaissave laikanèiø tekstynø ið tiesø nëra su-daryti pagal aiðkius reprezentatyvumokriterijus. Tekstynø apraðuose pateikia-mos tik ávairiø tekstø rûðiø proporcijos,bet ne jas lëmæ atrankos principai (tenpat). Iðimtis èia yra èekø kalbos teksty-nas, sudarytas tik pagal pasyviosios kal-bos vartosenos, t.y. skaitomumo ir klau-somumo, principus.Realiai ðiandieniniai tekstynai labiau

skiriasi ne pagal kalbos produkavimà arpasyvø vartojimà, bet pagal kità kriteri-jø: sakytinës � raðytinës jos daliø santy-ká. Pirmieji tekstynai buvo iðimtinai ra-ðytinës kalbos, jie dominuoja ir iki ðiol,nes yra þymiai pigiau parengiami. Ta-èiau savaime suprantama, kad individasdaugiau kalba nei raðo, antra vertus, pa-raðytà tekstà perskaito kur kas daugiauþmoniø nei iðgirsta kalbà. Tad niekas gerainë neþino, kokiu santykiu derëtø teksty-ne pateikti sakytinæ ir raðytinæ kalbosatmainà, o kà jau besakyti apie smulkes-nius ðiø dviejø komponentus. Teisi buvoG.Kennedy teigdama, kad tekstyno repre-zentatyvumo klausimas yra sunkiai ið-sprendþiamas, kadangi reprezentatyvu-mas yra nuomonës reikalas, tai jo galimalaikytis tik ið dalies (Kennedy 1998:62).Norint nustatyti realià kalbos vartosenà,kuri, beje, dël technologijø paþangos la-bai smarkiai kinta, bûtini sociologiniaityrimai. D.Biberis siûlo remtis teorija, pa-gal kurià bûtø galima nustatyti átraukia-mø tekstø kieká, jø atrankà, imèiø dydá,

Page 6: Marcinkeviciene R. Tekstynu Lingvistika

1 2 KALBOTYRA INFORMACINEI VISUOMENEI

be to, tà þmoniø sluoksná, kurio kalbànorima atspindëti tuo tekstynu, taigi rem-tis socialiniuose moksluose naudojamaisreprezentavimo metodais (Biber 1993).Jais nesiremiant tegalima tenkintis mini-maliais tekstø atrankos kriterijais, kurieraðytinës kalbos atveju buvo nurodytiJ.Sinclairio dar 1991 metais. Sinclairissiûlo, kad minimalûs tekstø atrankos kri-terijai turëtø apimti bent jau groþinæ �negroþinæ literatûrà, o kitu aspektu � kny-gas, þurnalus ar laikraðèius, formalius irne tiek formalius tekstus; be to, pagei-dautina kuo didesnë autoriø ávairovë pa-gal jø amþiø, lytá ir kilmæ (Sinclair1991:20).Tekstynø sudarymo praktika rodo, kad

oportunistiniai ir reprezentatyvûs teks-tynai ne tik neprieðtarauja vieni kitiems,bet yra susijæ kaip du skirtingi tekstynosudarymo etapai. Kennedy nurodo, kadyra trys svarbiausi tekstyno rengimo eta-pai: jo sandaros numatymas, tekstø ga-vimas ir jø kodavimas ar anotavimas,taèiau kur kas daþniau tekstyno rengi-mas prasideda nuo antrojo etapo, taiginuo oportunistinio tekstø archyvo kûri-mo, ið kurio po to atrenkami pagal tamtikras proporcijas tekstai (Kennedy1998:70, taip pat þr. Èermák 1997:189).Kaip jau minëta, tekstyno reprezentaty-vumà gali nulemti ir jo dydis. Kokio dy-dþio turi bûti tekstynas, kad be specia-lios atrankos, bûdamas oportunistinis jisbûtø ir reprezentatyvus? Be abejo, dide-lis, nes net ir 30 milijonø þodþiø apim-ties tekstynas yra maþas palyginti su tuotekstø kiekiu, ið kuriø jis yra atrinktas.Tekstyno reprezentatyvumas yra sun-

kiau pasiekiamas nei patikrinamas. No-rint patikrinti tekstyno reprezentatyvu-mà, reikia su juo padirbëti, o ne projek-tuoti apimtis spekuliatyviai, todël D.Bi-beris siûlo sudaryti bandomàjá tekstynë-lá pagal pasirinktas proporcijas, o pas-kui þiûrëti, ar jos atitinka norimus tiks-lus (Biber 1993). Kitas bûdas patikrinti

ne tiek tekstyno reprezentatyvumà, kiekjo ávairovæ yra nurodytas G.Kennedy. Taigerai þinomas teksto ar tekstyno þodþiøávairovæ rodantis santykis tarp visø irskirtingø þodþiø (type-token ratio) (Ken-nedy 1998:66�70). Galø gale, anot JamesCharles Fillmore, viskas vis vien grin-dþiama intuicija, nes bûtent ja matuoja-mas tekstyno reprezentatyvumas: jei aðþinau koká dalykà egzistuojant kalboje,tai jis turi atsispindëti ir tekstyne (Fil-lmore 1992:38). Jei ne viskà, kas rûpi,randi testyne, vadinasi, já reikia didinti,kad ir koks reprezentatyvus jis bûtø.Paskutiniai daug diskusijø keliantys

tekstynø tipai yra anotuoti bei koduotiir neanotuoti tekstynai. Þinia, tekstynastyrinëjamas netiesiogiai, su programiniaisárankiais. Esama keliø rûðiø netiesiogi-nio priëjimo prie teksto ir kartu keliørûðiø jo apdorojimo programø. Vienosjø nekeièia paties teksto, tik pateikia teks-tyno analizës rezultatus: ávairià statisti-kà, konkordansus ir pan. Kitoms priklausoávairios paþymos ir anotacijos, kurios pri-dedamos prie teksto jo formatavimo aranalizës labui. Teksto þymëjimas arba ko-davimas atsirado tekstynø gyvavimo pra-dþioje dël to, kad senieji kompiuteriainesugebëjo apdoroti teksto kaip teksto,bet jie mokëjo atpaþinti paþymas. Taipformatavimo paþymø sistema (mark-uplanguages) padëjo perkelti tekstus ið vie-nos maðinos á kità. Palaipsniui ji apëmëvis daugiau ir ávairesniø kalbos aspektø,netgi tekstø turinys buvo áspraustas ágrieþtus paþymø rëmus. Dabartinës tech-nologijos leidþia apdoroti tekstus jau bepaþymø sistemos. Bet senoji praktika ið-liko. Ðiandieninë formatavimo paþymøsistema apima tokius formaliuosius tekstostruktûros elementus, kaip nuorodas apieraðytinio teksto citatas, sàraðus, vardoraidþiø ar kitokias santrumpas, akroni-mus, knygø áþangas ir apendiksus, sky-rius, atskirø teksto daliø ir kitokius pa-vadinimus, tikrinius vardus. Sakytinës

Page 7: Marcinkeviciene R. Tekstynu Lingvistika

1 3Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

kalbos atveju galima þymëti, t.y. koduo-ti, pokalbio eiliðkumà, pertraukinëjimus,kalbëjimà vienu metu, tarmines formas,pauzes, negarsià, beveik negirdimà kal-bà (plaèiau þr. Kennedy 1998:84).Kaip matyti ið ðio neilgo iðvardijimo,

teksto kodavimas daugiau susijæs su struk-tûriniais jo elementais, taèiau jis apimair interpretacijos atvejus, kai paþymosvietà ir pobûdá lemia subjektyvi tyrëjonuomonë. Dar daugiau interprecijos esa-ma gramatinëse anotacijose, nes papras-tai jos remiasi tradicine, daugeliu atvejusubjektyvia nuomone ir susitarimu pa-remta gramatika (consensus grammar). Ga-væs gramatiðkai anotuotà tekstà, kom-piuteris netikrina gramatiniø kategori-jø, bet priima jas tokias, kokios jos yra,taigi ir analizës rezultatai daugeliu atve-jø yra ið anksto nulemti. Paradoksalu tai,kad struktûrinë tekstyno analizë panëðëjaá iki tekstynø buvusios lingvistikos pro-jekcijà á tekstyno duomenis. Anot J.Sinc-lairio, në viena ið tos lingvistikos prie-laidø ir aksiomø negalima pasitikëti, nesturimos analizës priemonës ir metodailabai ribojo tradicinæ lingvistikà (Sinc-lair 2000a).Tekstyno anotavimas yra netikæs dël

to, kad, jei tekstas yra þymëtas, kompiu-teris dirba su paþymomis ir ignoruojapaèià kalbà. Taigi jei þymime tekstynà,tai vëliau tiriame savàsias paþymas, o nepaèià kalbà. Ten, kur tinka, paþymos ga-li padëti analizei, bet kur kas daþniau jaipakenkti. Be to, paþymos paþeidþia tekstovientisumà, jos yra þmogaus intervenci-ja á tekstà. Paþymos sudaromos pagaltam tikrus analitinius modelius, o ðie sa-vo ruoþtu yra pavaldûs atskiroms teori-joms, tik per jas þvelgiama á tekstynokalbà; viskas, kas nesuþymëta, yra pra-randama, nepastebima. Taip autorius ap-saugomas nuo netikëtumø, jis nemato nie-ko, ko nenorëjo matyti. Teorijos, kurio-mis remiasi ávairûs þymëjimai, yra neto-bulos, be to, jos nukreipia mûsø dëmesá

viena linkme ir riboja mûsø màstymà.Dar viena anotacijø yda � tekstas per-kraunamas paþymomis, já tampa sunkiauperdirbti, nes apimtis patrigubëja ar pa-didëja dar daugiau kartø.Visi ðie ir panaðûs argumentai prieð

tekstynø anotavimà yra iðsakomi ling-vistø, o ne informatikø, be to, tø lingvis-tø, kurie naudoja tekstynus ne tiek tik-rinti ið senø teorijø kylanèioms hipote-zëms, bet kurti naujoms hipotezëms, ið-ryðkëjanèioms ið darbo su dideliais teks-tø masyvais (þr. 2. ir 3.2. corpus-based vs.corpus-driven linguistics). Tekstynø inspi-ruota lingvistika nesiremia anotuotaistekstais, propaguoja gryno teksto politi-kà ir tokius programinius instrumentus,kurie dirba su grynu tekstu, o ne su joanotacijomis, nes tik ið tokio teksto ið-ryðkëja nauji modeliai, kurie bûtø pra-þuvæ paþymomis uþterðtame tekste (Sinc-lair 1991:21). Be abejo, jei neklaidinan-èios, anotacijos labai palengvina paieðkàir bet kokià lingvistinæ tekstyno analizæ.Ið tø tekstynø tipø, dël kuriø tikslingumonediskutuojama, pirmiausia minëtini ben-drieji bei specialieji tekstynai. Bendrieji yraskirti ne kokiai vieno tipo, bet daugialypeianalizei, juos gana sunku parengti, juolabpadaryti subalansuotus ir reprezentatyvius,nes bendrojo tekstyno adresatas yra visai ne-aiðkus. Specialieji tekstynai ðiuo atveju yrapaprastesni, nes kuo aiðkesnis tikslas, ku-riam reikia tekstyno, tuo lengviau numatytijo sandarà. Specialieji tekstynai skiriasi pa-gal du poþymius: pagal savo tikslus, kamtekstynas skirtas, ir pagal tekstyne esanèiøtekstø pobûdá. Ið pirmosios grupës geriau-siai yra þinomi kalbos mokymo tekstynai, iðantrosios � mokiniø (learner�s corpus) ir vai-kø kalbos tekstynai. Pastarieji sudaryti arbaið transkribuotø vaikø kalbos áraðø, taigi iðesmës priklauso sakytiniø tekstynø grupei,arba ið studentø ir moksleiviø raðiniø. Jieskirti psicholingvistinëms bei edukologinëmskalbos iðmokimo studijoms, o uþsienio kal-bos mokymosi atveju dar gali bûti vertingi irgimtosios bei uþsienio kalbos interferencijaitirti (plaèiau þr. 3.5.1.) Ðvietëjiðki arba kal-bos mokymui naudojami tekstynai yra au-tentiðkø tekstø rinkiniai, pagal poreikius irmokymo programà atrenkami ið ávairiø ðal-

Page 8: Marcinkeviciene R. Tekstynu Lingvistika

1 4 KALBOTYRA INFORMACINEI VISUOMENEI

tiniø. Jie gali bûti formuojami ir kalbos mo-kytojø, ir paèiø studentø, be to, jie papildytielektroniniais þodynais, þinynais, pratimørinkiniais ir specialia programine áranga, lei-dþianèia dirbti su mokytoju ir savarankiðkai(Meyer et al. 2000).

Pagal tekstyne esanèiø tekstø pobûdá esamapaèiø ávairiausiø teminiø ar þanriniø teksty-nø, kurie gali bûti autonomiðki ar áeiti á di-desná bendrojo pobûdþio tekstynà. Kadangididþiuma tekstynø iki ðiol yra raðytinës kal-bos, tai sakytinës kalbos tekstynus ar sude-damàsias sakytinës kalbos dalis raðytinës kal-bos tekstynuose su tam tikromis iðlygomisbûtø galima priskirti specialiesiems teksty-nams. Tolydþio populiarëjantys sakytinëskalbos tekstynai nuo raðytinës kalbos teks-tynø skiriasi ne tik uþraðymo forma, transk-ripcija bei specialiomis paþymomis, bet irþanrais, ðnekos atrankos principais ir pan.Daugelis jø, be grafinio vaizdo, dar turi irpirminá garsiná pavidalà, idealiu atveju su-derintà su raðtu.

Prie specialiøjø tekstynø galëtø bûti priskirtiir senøjø raðtø arba istoriniai tekstynai, su-darantys ryðkià opozicijà dominuojantiemsdabartinës kalbos tekstynams. Didþiausiajø dorybë yra ta, kad maþai kam buvæ priei-nami seniai raðyti tekstai, ágavæ elektroninápavidalà, tarsi atgyja naujai jø vartosenai.

Didelæ atskirà tekstynø grupæ sudaro keliøkalbø tekstynai, apimantys kelias kalbas �nuo dviejø iki neriboto kiekio. Paraleliustekstynus sudaro originalo ir vertimo teks-tai, sulygiuoti papastraipiui ar net pasaki-niui. Paralelinimo darbà ðiandien atlieka gau-sios, gana efektyvios, ávairiais principais su-darytos automatinio paralelinimo progra-mos, kuriø sulygiuotus tekstus þmogui terei-kia tik ðiek tiek pakoreguoti (Oakes et al.2000, Simard et al. 2000, McEnery et al. 2000).Paralelûs tekstynai yra nepakeièiama prie-monë kalboms mokyti (Barlow 2000, Peters2000), vertimo ekvivalentams gauti (Daniels-son et al. 2000, Pearson 2000) bei kalbomslyginti (Johansson et al. 2000, Schmied et al.2000). Jie sudaro pavyzdþiais pagrástø maði-ninio vertimo sistemø pagrindà, yra vartoja-mi ávairiuose vertëjams skirtuose programi-niuose paketuose kaip jau anksèiau verstøteksto atkarpø ðaltinis (þr. 3.5.2.).

Esama ir kitokio tipo keliakalbiø tekstynø,sudarytø ne ið originalo ir vertimo, bet iðoriginaliø dviejø ar daugiau kalbø tekstø, átekstynà sudëtø pagal tuos paèius atrankoskriterijus ir tekstyno komponavimo princi-pus, o geriausiai, ir pagal panaðø turiná, ben-

dras abiem ar keliom kalbom temas. Tai �palyginamieji tekstynai, ið pradþiø naudotidaþniausiai kontrastyvinës lingvistikos tiks-lams, bet dabar taikomi ir vertimo ekviva-lentams rinkti, terminø ar kitø leksiniø vie-netø vartosenai tirti, kultûrai, atsispindin-èiai kalboje, tyrinëti ir dar daugeliui kitø tiks-lø. Palyginamøjø ar paraleliø tekstynø kûri-mas buvo ne vieno tarptautinio projekto tiks-las.

1.3. TEKSTYNØ ANALIZËSPRIEMONËS

Tekstynø analizës priemonës, ávairios pro-gramos ir árankiai � nors ir yra neatski-riama, taèiau daþnai nutylima tekstynødalis. Tai ypaè pasakytina apie lingvis-tus, kurie mieliau aptaria darbo su teks-tynais eigà ir rezultatus nei programinespriemones. O jos yra labai svarbios, neslemia darbo spartà ir kokybæ. Aptarti dar-bui su tekstynais reikalingus instrumen-tus (software or lingware tools) nëra pa-prasta ne vien todël, kad jø esama daugir ávairiø, bet dar ir dël sunkiai apibrë-þiamo jø statuso.Taigi kà galima laikyti instrumentu?

Ar juo galima laikyti programavimo kal-bas, jei jos, pavyzdþiui, tokios kaip sed irawk, leidþia legviau programuoti þenkløvirtinëliø apdorojimo procedûras arbaSGML (Standard General Markup Lan-guage) þenklinimo priemones, kurios þy-mi teksto bibliografijà, struktûrà ir darkai kà, pvz., jo þodþiø gramatines kate-gorijas, t.y. kalbos dalis (Erjavec 1995:40)?Drauge su tekstiniais resursais pateikia-muose árankiø sàraðuose tokiø nerasi (Bi-ber et al. 1998:285�286). Ar galima áran-kiais laikyti tikràsias kompiuterinës ling-vistikos sistemas � dideles ir sudëtingas,atliekanèias teksto morfologinæ analizæ,generuojanèias leksikonus, t.y. kompiu-terinius þodynus ir pan? Galiausiai, arárankiu laikytina ávairialypë teksto sta-tistika, tokia kaip teksto ilgis, skaièiuo-jant pagal þenklø, þodþiø ir þodþiø for-

Page 9: Marcinkeviciene R. Tekstynu Lingvistika

1 5Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

mø (visø tekstà sudaranèiø ir skirtingø)bei sakiniø kieká? Prie jos priklauso irávairiø testø pagrindu gauti þodþiø irþodþiø formø, lemø, prasminiø þodþiøar kolokatø daþniniai sàraðai. Á ðiuos klau-simus vargu ar rasime atsakymà teksty-nø ar kompiuterinës lingvistikos litera-tûroje, kurioje prototipiniais laikomi ðiedarbui su tekstais, bet nebûtinai teksty-nais, skirti árankiai: teksto lemavimo, þy-mëjimo ar anotavimo bei analizës progra-mos, atitinkamai: lemuokliai (lemmatisers),þymekliai (taggers) ir parseriai (parsers)3.Ðie árankiai iðvardyti jø atsiradimo ir

panaudojimo tekstui apdoroti tvarka. Pir-miausia grynas tekstas lemuojamas � ið-vestinës jo þodþiø formos suvedamos ápagrindines ar antraðtines (tikriau � prieiðvestiniø formø priraðomi antraðtiniaijø pavidalai), po to keleriopas lemas tu-rintys atvejai (pvz., þodþio forma laimësgali bûti sulemuota ir kaip laimë, ir kaiplaimëti, plaèiau þr. 2.1.1. ir Zinkevièius2000) iðaiðkinami. Tam reikalui turi bûtisukurta speciali programa ar árankis, an-gliðkai vadinamas disambiguator, pamor-femiui iðvertus reiðkiantis �iðdviprasmin-tuvà�, o pats procesas � ambiguity resolu-tion, t.y. dviprasmybës, o daþniau� gra-matinës ar semantinës daugiaprasmybësiðaiðkinimà. Ði programa apþvelgia ne-aiðkios formos kontekstà ir pagal já nu-stato labiausiai tikëtinà lemà. Ji ir tampamorfologine tos þodþio formos anotacijaarba þyme. Paèios áprasèiausios ir daþ-niausiai vartojamos yra kalbos dalis nu-sakanèios þymës (part-of-speech tags), norsgali bûti nurodytos ir tikslesnës morfo-loginës kategorijos.Tekstyno anotavimas neapsiriboja vien

morfologija, todël dar esama sintaksiniø,semantiniø, nusakanèiø skirtingas dau-giareikðmio þodþio reikðmes, ir net teks-tiniø ar diskursiniø þymiø. Sudëtingiau-sias teksto apdorojimo etapas po anota-vimo � sintaksinë analizë, kurià sudarosintaksinius ryðius vaizduojanèio medþiokûrimas kiekvienam teksto sakiniui (apie

èekø kalbos sintaksinæ analizæ þr. Hajièet al. 1997). Ji atliekama su parseriu. Esa-ma ir dar sudëtingesniø darbo su tekstuetapø ir juos atitinkanèiø priemoniø: teks-to generavimo, vertimo, santraukø auto-matinio rengimo sistemø, bet jos � jaunebe tekstynø, o kompiuterinës lingvis-tikos sritis.Tekstø lemavimo, anotavimo ir sintak-

sinës analizës programos, taip pat ir ávai-rios statistinës priemonës � sàraðø beikonkorsansø generavimo, tekstø parale-linimo, kolokacijø paieðkos ir kiti èia ne-suminëti árankiai (plaèiau apie kai ku-riuos ið jø þr. Utka 2000) leidþia prietekstynø kaupti jø satelitus � daþniniusþodþiø sàraðus, leksines duomenø ba-zes, kompiuterinius leksikonus, konteks-tinius arba kolokacijø þodynus, sintaksi-niø medþiø bankus ir panaðius ið teksty-nø gautus produktus. Jie vertingi ir pa-tys savaime, ir kaip sudedamoji dalis ávai-riø programiniø paketø ar sudëtinges-niø sistemø, kad ir maðininio vertimo. Oðios savo ruoþtu gali bûti sukurtos tiekstatistiniu tikimybiniu, tiek ir taisykliømetodu (plaèiau apie ðiuos metodus þr.3.5.2.). Metodas èia toks svarbus, kaddaþnai jis nurodomas árankio pavadini-me, pvz., tikimybinis þymeklis (probabi-listic tagger). Statistiniai árankiai yra spar-tesni, patikimesni ir efektyvesni nei tai-sykliø pagrindu parengtieji, jø efekty-vumas siekia 96 procentus. Kalbininkøjie yra tuo labiau vertinami, kuo maþiaujie siejasi su subjektyvia, nuo atskirø teori-jø priklausanèia interpretacija ir gali dirbtisu minimaliai ar visai neanotuotu teks-tu. (þr.1.2)

1.4. LIETUVIØ KALBOS TEKSTYNAI

Lietuviø kalbos tekstynø4 radimosi pra-dþia derëtø laikyti L.Grumadienës ir V.Þi-linskienës parengtà 1 200 000 þodþiø da-bartinës ðnekamosios lietuviø kalbos teks-tynà, imèiø pagrindu sudarytà ið XX a.

Page 10: Marcinkeviciene R. Tekstynu Lingvistika

1 6 KALBOTYRA INFORMACINEI VISUOMENEI

pabaigos vieðai paskelbtø keturiø pagrin-diniø stiliø tekstø (Grumadienë ir kt. 1997v�viii). Tekstynas buvo lemuotas, o jopagrindu iðleisti keli þodynai, ið kuriøsvarbiausi yra Atgalinis dabartinës lietu-viø kalbos þodynas ir Daþninis dabartinësraðomosios lietuviø kalbos þodynas. Pats teks-tynas vieðam naudojimui neprieinamas,todël negalima komentuoti kitø nei nu-rodytø aukðèiau minëtame ðaltinyje josavybiø.Leksikografijos tikslui kompiuterizuo-

jami senieji raðtai (Ambrazas ir kt. 1998)galëtø bûti laikomi istoriniu lietuviø kal-bos tekstynu. Specialiaisiais nedidelës ap-imties tekstynais taip pat su tam tikro-mis iðlygomis bûtø galima vadinti moks-liniam darbui, daþniausiai disertacijoms,sudarytus tekstø rinkinius, pvz., vaikøkalbos (Savickienë 1999), internetiniø po-kalbiø svetainiø (Ryklienë 2000) ir visuskitus, parengtus turint specialø tyrimotikslà ir naudojamus tik jø sudarytojø.Èia reikia pasakyti, kad surinkti elektro-niniai tekstai, plaèiai imant, daþnai bû-na vertingesni nei vienu kuriuo aspektuatlikta ir publikuota jø analizë, nes kitityrinëtojai ar leksikografai praktikai galipritaikyti juos savo reikmëms. Todël la-bai sveikintinas yra istorinio tekstyno kû-rëjø kvietimas bendram darbui, leidþiantismanyti, kad jo rezultatais taip pat busbendrai naudojamasi (Ambrazas ir kt.1998:200).Vieðu ir visiems prieinamu bendrojo

pobûdþio lietuviø kalbos tekstynu, skir-tu kuo ávairesnëms jo vartotojø reik-mëms, laikytinas Vytauto Didþiojo uni-versiteto dabartinës lietuviø kalbos teks-tynas. Jis buvo sumanytas kaip �didelis,neanotuotas ir nekoduotas, á skaitytojàorientuotas, daugiausiai iðtisø periodi-kos ir knygø tekstø, daugiau bendro po-bûdþio nei specialus, didelës temø ir ki-tokios (leidiniø pobûdþio, daþnumo, lei-dimo vietos, autoriø lyties, amþiaus, kil-mës) ávairovës autentiðkos raðytinës lie-

tuviø kalbos tekstynas� (Marcinkevièie-në 1997c:77). Toks jis ir yra, dabar jaupasiekæs 60 mln. þodþiø apimties ribà irtoliau vis didinamas tekstynas. Juo gali-ma naudotis visu, viena ar iðkart kelio-mis jo sudëtinëmis dalimis: periodikos,sudarytos ir bendrøjø ir specialiø leidi-niø, neperiodikos (groþinës ir negroþi-nës literatûros knygø bei dokumentø rin-kiniø) tekstynëliais (þr. VDU Kompiute-rinës lingvistikos centro puslapius inter-nete http://donelaitis.vdu.lt).Keleriø metø darbo su tekstynu patir-

tis parodë jo apimties privalumus ir trû-kumus, todël, neatsisakant didelio teks-tyno idëjos, ið jo ketinama parengti dardu maþesnius tekstynus. Kai didysis teks-tynas sieks 100 mln. þodþiø ribà, ðalia joatsiras keliø deðimèiø ir keliø milijonøþodþiø tekstynai. Ðimtinis tekstynas irtoliau liks nekoduotas ir neanotuotas, lai-komas ir gausinamas kaip patikimø sta-tistiniø duomenø ir retesniø þodþiø var-tojimo ðaltinis, deðimtinis bus koduotaspagal SGML standartà bibliografiðkai irstruktûriðkai, kitaip sakant, vartotojui busgalima matyti teksto bibliografijà beistambiausius jo struktûros vienetus � pa-vadinimà, pradþià ir pabaigà, atskirø jodaliø, pastraipø, sakiniø ribas. Pats ma-þiausias tekstynëlis, be viso to, dar busir morfologiðkai anotuotas.VDU tekstynas laikomas subalansuo-

tu, nes ið turimo be abribojimø gautøtekstø archyvo á tekstynà pagal pasirinktasproporcijas perkeliama tik dalis tekstø.Tekstø atranka riboja ne tik pasirinktastekstyno tipas (èia áeina tik nepriklauso-mybës laikotarpio originaliosios, nevers-tinës kalbos tekstai), bet ir leidybos ten-dencijos. Ðiuo metu 70 % visø tekstø su-daro periodiniø, 26% neperiodiniø lei-diniø medþiaga. Likæ procentai skirti at-skiram verstinës literatûros tekstynëliui.Tekstynà þadama ávairinti keliomis

kryptimis. Pirmiausia jame reikia atski-ro sakytinës kalbos tekstynëlio, kad bû-

Page 11: Marcinkeviciene R. Tekstynu Lingvistika

1 7Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

tø galima palyginti sakytinës ir raðomo-sios kalbos ypatumus, nes turimo Lietu-vos Respublikos Seimo posëdþiø proto-kolai toli graþu neatspindi visos gyvo-sios kalbos ávairovës. Jau dabar á teksty-nà atskiru vienetu áeina ir toliau átrau-kiama verstinë literatûra, taip ruoðiantiskurti didesnës apimties paralelø teksty-nà. O kol bus pridëti originalo tekstai irsuparalelinti su vertimais, verstinæ lie-tuviðkàjà literatûrà galima naudoti ir tirtikaip atskirà verstinës kalbos tipà (Utka1999). Treèià tekstyno plëtimo ir ávairi-nimo kryptá ðalia sakytinës ir verstinëssudarytø internetinës kalbos tekstai, ku-rie sudaro nuolat sparèiai auganèià mû-sø kalbos vartosenos dalá.Taigi VDU tekstynas yra ir turëtø bûti

gana ávairus. Ávairus ir subalansuotas,bet ar reprezentatyvus? Á ðá klausimà at-sakyti tikrai sunku, nes nëra aiðku, ko-kie kriterijai turi bûti pasirenkami teks-tyno sandarai lemti (þr.1.2.): kalbos eli-tiðkumas ar demokratiðkumas, leidybaar skaityba, tipiðkumas ar specifika. Kàtekstynas turi atspindëti � stilius, regist-rus, temas, þanrus, demografines raðy-tojø skirtybes? Viskà ið karto ar kai kàpasirinktinai? Pasakymas, kad tekstynasturi atspindëti ðiandieninæ lietuviø kal-bà, yra nieko nesakantis, nes labai abst-raktus. Norint bent kiek aiðkiau ásivaiz-duoti tà idealøjá atspindimà objektà, reiktølabai patikimos sociologinës apklausosduomenø, ið kuriø galëtø paaiðkëti: a)kiek ir kokios kalbos (ar kalbø) ðiandienLietuvoje vartojama, b) kiek klausoma,skaitoma, kalbama ir raðoma, c) kas skai-toma ir kas raðoma ar leidþiama, d) iðkur ir kokiais kanalais kalba pasiekia ausá,e) su kuo ir kokiomis komunikacijos prie-monëmis bendraujama, f) kaip pasiskirstoLietuvos visuomenë pagal vartojamos kal-bos ir atskirø jos atmainø ypatumus irdar á daugelá kitø. Tik turint tokius duo-menis, bûtø galima bandyti rengti repre-zentatyvø tekstynà, o tuo tarpu reikia

tenkintis kuo didesne tekstyno apimtimiir ávairove, tikintis, kad tie du rodikliaikompensuos þiniø apie ðiandieninæ mû-sø kalbà stygiø.Baigiant lietuviðkøjø tekstynø apþval-

gà, reikia trumpai paminëti kelis kitusnedidelius, bet svarbius VDU Kompiu-terinës lingvistikos centre parengtus teks-tynëlius. Pirmiausia tai lietuviðkojo Ðven-tojo Raðto vertimo lemuotas elektroninistekstas ir jo pagrindu sudaryta konkor-dancija5 bei svarbiausiøjø þodþiø sàva-das (plaèiau þr. Marcinkevièienë 1999a),kuriam labai stinga tekstø originalo kal-bomis, bei dviejø filosofinës ir groþinësliteratûros kûriniø Platono Valstybë irG.Orwell�o 1984 metai vertimai, supara-lelinti su originalo ir dar daugelio kitøvertimo kalbø tekstais (þr. East meetsWest, CD-ROM).Kokius dar tekstynø tipus labai reiktø

turëti lietuviø kalba? Galima nurodytikeletà tipø: bendrojo pobûdþio ir specia-liosios literatûros paralelius tekstynus,ið kuriø bûtø galima rinkti vertimo ati-tikmenis ir rengti dvikalbius bendruo-sius ir atskirø srièiø terminø þodynus(Marcinkevièienë 2000b), palyginamuo-sius6, sudarytus pagal kitø kalbø teksty-nø pavyzdá, kuriuos bûtø galima taikytikontrastyvinei keliø kalbø analizei beisakytinës kalbos, turinèius ir garsiná, irtranskribuotà pavidalà, tekstynà. Taiginorint paruoðti sàlygas lietuviø kalbaikompiuterizuoti, darbo dar yra daug.Darbui su VDU Kompiuterinës lingvistikoscentre esanèiais lietuviø kalbos tekstynaisnaudojama keliø tipø programinë áranga: uni-versali, nuo kalbos nepriklausanti ir specia-liai pritaikyta lietuviø kalbai. Universalusyra Liverpoolio universiteto profesoriaus Mi-ke�o Scotto parengtas programiniø árankiøpaketas WordSmith Tools, leidþiantis dirbtisu palyginti dideliu, taèiau ribotos apimtiestekstu ar tekstynu, naudojant ávairialypæ sta-tistikà ir jos pagrindu generuotus visø arprasminiø þodþiø bei kolokatø sàraðus, kon-kordansus bei kolokatø medþius, iðrenkantisvertimo atitikmenis ið paraleliø tekstø ir pan.

2

Page 12: Marcinkeviciene R. Tekstynu Lingvistika

1 8 KALBOTYRA INFORMACINEI VISUOMENEI

(Scott 1997). Ði programa pritaikyta tik per-sonaliniam kompiuteriui, o internetiná VDUtekstyno variantà aptarnaujanti programaCUE (Corpus Universal Examiner) teikiamenkesniø paieðkos galimybiø (þr. VDUKompiuterinës lingvistikos centro puslapiushttp://donelaitis.vdu.lt), nors ir aprëpia kurkas didesná tekstø kieká. Jos autorius � Oli-veris Masonas ið Birminghamo universiteto(Mason 1996).

Ðios programos skirtos statistinei tekstynoanalizei ir atskirø jo vienetø paieðkai. Teks-tynui lemuoti ir morfologiðkai anotuoti yraskirtas Vytauto Zinkevièiaus Lemuoklis (Zin-kevièius 2000). Daugialypæ paskirtá turiTwente universiteto magistro Jaroeno Klum-perio parengtas konkordavimo, paralelini-mo, daugiakalbiø vertimo atitikmenø iðga-vimo bei registravimo paketas Muldi (MultiLingual Database Interface), taikytas dau-giakalbei filosofiniø terminø duomenø bazeirengti (Klumper 2000, Marcinkevièienë ms).Ið svarbesniø tyrimo, o ne tekstyno prieþiû-ros ir jo palaikymo darbams skirtø árankiødar minëtina konkordanso eiluèiø klasifika-vimo bei kolokacijø iðgavimo programa Lek-sikografas, parengta Artûro Gruodþio, bei Vi-do Daudaravièiaus internetiniø laikraðèiøtekstø kompiliavimo ir apdorojimo progra-ma Kolektorius, leidþianti automatiðkai pa-pildyti tekstynà naujais tekstais.

Dar bûtinai reiktø keliø specialiai lietuviøkalbai rengtø árankiø: programos, leidþian-èios atsisakyti netinkanèiø Lemuoklio inter-pretacijø homonimijos ar daugiareikðmiðku-mo atveju, kad bûtø galima vienareikðmið-kai anotuoti tekstà kalbos dalimis ar ir kito-mis morfologinëmis ypatybëmis. Kitas svar-bus uþdavinys � parengti sintaksinës anali-zës priemonæ � parserá, be kurio neveiks kadir pati paprasèiausia maðininio vertimo sis-tema. Galima bandyti ðiuos árankius ásigytiið laisvai gaunamø ar nusipirkti ir po to ban-dyti pritaikyti juos lietuviø kalbai. Bet kiekrodo kitø ðaliø patirtis, tam esama nemenkøkliuviniø: ávairûs siûlomø programø defek-tai, tikslios dokumentacijos stygius, neati-taikomos platformos ir standartai, kûrëjø ne-noras ar negalëjimas jø palaikyti, o galiau-siai tai, kad didþiumos jø pagrindas yra visaikitokio tipo kalba nei lietuviø, t.y. anglø kal-ba. Todël trûkstamas programas reikia pasi-gaminti patiems, niekas kitas uþ mus to ne-padarys, nes negalime privilioti kitatauèiøprogramuotojø nei savosios rinkos dydþiu,nei kalbos populiarumu.

2. DARBO SU TEKSTYNUYPATUMAI

Programiniai árankiai yra neatskiriamatekstyno dalis, todël darbo su tekstynuypatumai yra nulemti automatinës ana-lizës rezultatø: kokius duomenis gauna-me panaudojæ vienà ar kità áranká, kaipjuos toliau panaudojame saviems tyrimotikslams. Taèiau pirmiau nei dël naudo-tinø árankiø ar jais gautø ávairiø pro-duktø � þodþiø, þodþiø formø sàraðø,konkordansø, kolokatø medþiø � reikiaapsipræsti dël tekstyno naudojimo prin-cipo ir masto. Èia galimas dvejopas po-þiûris: tekstyne galima ieðkoti pavyzdþiøpaèiø ávairiausiø kalbos vienetø distri-bucijai tirti tuomet, kai probleminiai ana-lizës klausimai bei pirminës hipotezëskyla ið kitø nei TL kalbotyros ar kitokiømokslø srièiø. Tuo atveju turime reikalosu tekstynais paremta (corpus-based ap-proach) analize. Kadangi ðiuo atveju teks-tynu gali bûti remiamasi fragmentiðkai,ið jo renkami tik atskiri ádomûs ir vertin-gi pavyzdþiai, tai paprastai naudojama-si tekstyno konkordavimo programa, iðkurios gautas konkordansas ir teikia rei-kalingà informacijà.Kitas naudojimosi tekstynu bûdas pri-

klauso iðimtinai TL ir yra vadinamas teks-tyno inspiruota (corpus-driven approach) ana-lize, kurios esmë � kelti tyrimo klausi-mus ir formuluoti hipotezes remiantis teks-tyno medþiaga, ankstesne jo analize (pla-èiau apie ðiuos du analizës bûdus skaityk3.2.). Ðiuo atveju tekstynas naudojamasiðsamiai, pagal Charles James Fillmore(1992:39) ávardytà nuodugniosios anali-zës principà (a principle of total accountabi-lity), kai bûtina aptarti visas konkordan-so eilutes, visus rastus tiriamojo kalbosvieneto vartosenos pavyzdþius. Ðio prin-cipo savo darbuose laikosi visi tekstynølingvistai. Bûtina pasakyti, kad tekstynonaudojimosi principas, ar jis TL hipote-ziø ðaltinis, ar tik kitokiø hipoteziø tikri-

Page 13: Marcinkeviciene R. Tekstynu Lingvistika

1 9Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

nimo vieta, bei jo naudojimo mastas ne-bûtinai turi sutapti. Nuodugniosios ana-lizës principas gali bûti taikomas ir teks-tynais paremtai analizei, o TL hipotezëstikrinamos naudojant atrankinius teksty-no duomenø taikymo metodus.Darbo su tekstynu ypatumus, be kon-

kreèiø árankiø ir naudojimosi principo,dar sàlygoja ir treèiasis veiksnys � teks-tyno tipas. Vienaip bus dirbama su vie-nos kalbos, kitaip su dvikalbiais ar dau-giakalbiais tekstynais, vienaip su koduo-tais ir/ar anotuotais, kitaip su gryno teks-to tekstynais. Kitos tekstynø savybës �dydis, reprezentatyvumas, kalbos tipas(sakytinë ar raðytinë) bei tekstø pobû-dis � neturi lemiamos reikðmës darbuisu tekstynu, tik to darbo rezultatams.Tad toliau bus aptariami darbo su þo-dþiø ir þodþiø formø sàraðais bei kon-kordansais ypatumai neanotuotame lie-tuviø kalbos tekstyne.

2.1. SÀRAÐAI

Pats paprasèiausias ir istoriðkai pirma-sis statistinio tekstø apdirbimo rezulta-tas yra daþniniai þodþiø ar þodþiø for-mø sàraðai iki tekstynø buvusioje erojeþinomi daþniniø þodynø vardu (plg. lie-tuviðkieji daþniniai þodynai). Ðiandien,kai kompiuterinës technologijos teikiapuikias galimybes greitai ir ið bet kokiodydþio ir pobûdþio tekstyno generuotidaþniná þodþiø sàraðà, tinkantá paèiomsávairiausioms taikomojo pobûdþio leksi-kografø, informatikø reikmëms bei viso-kiø mokslo ðakø fundamentaliesiems ty-rimams, tokie þodynai, ypaè popieriniupavidalu, nebeleidþiami.Esama dviejø tipø daþniniø sàraðø: þo-

dþiø formø arba, tiksliau pasakius, ne-kaitomø þodþiø ir kaitomø þodþiø for-mø, ir lemø arba antraðtiniø þodþiø sà-raðø (dar galima nurodyti abëcëlinius daþ-nio þodynus bei tuos daþnio þodynus,

kuriuose þodþiai yra iðrikiuoti pirmojopasirodymo tekste tvarka, bet jie laikyti-ni pirmøjø dviejø atmainomis ir neapta-rinëtini, plaèiau þr. Sinclair 1991:30�32).Toliau trumpumo dëlei ir laikantis tarp-tautinës konvencijos, nes juk ir tekstynøapimtis ávardijama milijonais þodþiø, norsturima omenyje nekaitomi þodþiai ir þo-dþiø formos, � ðie sàraðai bus vadinamiþodþiø ir lemø sàraðais. Þodþiø sàraðaigaunami sujungus ir daþnumø tvarka ið-rikiavus nekaitomus þodþius ir identið-kas kaitomø þodþiø formas. Lemø sàra-ðai randasi dviem bûdais: paprastai jiegeneruojami ið morfologiðkai anotuototekstyno (Grumadienë ir kt. 1997), norsgali bûti rengiami ir neanotuoto teksty-no pagrindu parengus nekaitomø þodþiøir þodþiø formø sàraðà ir po to já sulema-vus. Abiejø tipø sàraðai turi savø priva-lumø ir trûkumø. Þodþiø formø sàra-ðuose iðsaugoma vertinga informacija apie(þr. 3.4.4.) skirtingà atskirø to paties þo-dþio morfologiniø formø daþná, o lemøsàraðuose ði informacija dingsta. Taèiaulemø sàraðai paprastai yra trumpesni irdël to parankesni tuomet, kai pakankaþinoti tik skirtingø lemø vartojimo daþná.Tiek nekaitomø þodþiø ir kaitomø þo-

dþiø formø, tiek ir lemø sàraðai atspindiesmines ir, kaip manoma, universaliasstatistines þodþiø vartojimo tendencijas.Yra nustatyta, kad bet kurioje kalbojeyra labai nedaug þodþiø, kurie vartoja-mi labai daþnai, ir daug retai vartojamøþodþiø. Paprastai apie pusæ daþniniosàraðo þodþiø sudaro vienkarèiai atski-rø jø formø pavartojimo atvejai. Jie nëraádomûs tiriant tekstynà jame esanèiø dës-ningumø aspektu, todël daugelis tyrëjøjø atsisako net dirbdami ir su maþais,vieno milijono þodþiø apimties teksty-nais. Lietuviø kalbos tekstyno duome-nys patvirtina bendras statistines tenden-cijas. Ið 60 mln. þodþiø tekstyno buvogautas 1.2 mln. þodþiø ilgio daþninis ne-kaitomø þodþiø ir kaitomø þodþiø for-

Page 14: Marcinkeviciene R. Tekstynu Lingvistika

2 0 KALBOTYRA INFORMACINEI VISUOMENEI

mø sàraðas. Santykis tarp viso tekstynoþodþiø kiekio, t.y. jo apimties, ir skirtin-gø þodþiø kiekio (type token ratio) rodotekstyno þodingumà, jo leksinæ ávairovæ.Ðis statistinis rodiklis paprastai taiko-mas atskirø autoriø tekstams, bet taippat sëkmingai juo galima matuoti atski-rø tekstyno daliø ir jo viso þodingumà.Daþniniame sàraðe þodþiø ir jø formø

daþnumas pasiskirsto labai netolygiai.45.54% visø sàraðo þodþiø, t.y. beveik

1 diagrama

Vidutinis þodþio daþnumas 1,2 mln. þodþiø sàraðe

2 diagrama

Þodþiø daþnumø pasiskirstymas tekstyne

pusë sàraðo, yra vartojami tik 1 kartà,tokie þodþiø pavartojimo atvejai tesuda-ro 1.04% visos tekstyno þodþiø vartose-nos dalies. Tarpinæ vieta uþima þodþiaiir jø formos, pavartotos nuo 2 iki 1000kartø (þr. 1 lentelæ). Patys daþniausi þo-dþiai ir þodþiø formos yra pavartotosdaugiau nei 1000 kartø, bet jø susidarovos pusë procento visø daþninio sàraðoformø. Tokia nedidelë þodþiø ir jø for-mø dalis padengia 65% visos vartose-

> 100001000-9999

100-99910-99

2-91

Þodþiø formø dalis

Vartosenos dalis0,00%

5,00%

10,00%

15,00%

20,00%

25,00%

30,00%

35,00%

40,00%

45,00%

50,00%

Þodþiø daþnumas

11 719

35

405

61

101

141

3695

50

14

216

24

77

9 6 235 4 10

50

100

150

200

250

300

350

400

450

500

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64

Page 15: Marcinkeviciene R. Tekstynu Lingvistika

2 1Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

nos, kitaip sakant, nedidelis daþnai kar-tojamø þodþiø kiekis apima daugiau neipusæ tekstyno ploto. Ðis þodþiø formøkiekio ir jø vartosenos dalies santykisvaizdþiai atsispindi 2 diagramoje.Diagramos kreivë parodo, koká vidu-

tiná pavartojimø skaièiø atitinka kokiasàraðo dalis (procentais). Ji buvo gautavisà sàraðo ilgá padalijus á 100 lygiø da-liø (horizontali aðis), po to buvo skai-èiuojamas þodþiø pasikartojimo vidur-kis kiekvienai daliai (vertikali aðis). Antpaèios kreivës yra nurodyti pavartoji-mo kartai. Nors visa kreivë ir netelpa ágrafikà, bet matoma jos dalis aiðkiai ro-do, kokia palyginti nedidelë ir tolygiaibesikeièianti yra tarpinë, t.y. vidutinið-kai daþnai vartojamø, þodþiø dalis. Do-minuoja itin daþni ir itin reti þodþiai arjø formos.Tokie daþniniai sàraðai, nelygu ið ko-

kio dydþio ir kokio pobûdþio tekstynogeneruojami, gali turëti labai ávairialypæpaskirtá. Jei sudaryti ið nelemuoto teks-tyno, jie gali bûti naudojami informati-koje kaip pagrindas statistinei raidþiø,jø deriniø, þodþiø ir jø formø analizei.Daþniná sàraðà galima naudoti dalimis,pvz., atsirinkti jo pradþioje esanèius tar-nybinius ir kitus savarankiðkos leksinësreikðmës neturinèius þodþius (stop-words),pasitikrinti tiriamojo þodþio formø daþ-numus, jø vietas bendrame sàraðe ir kai-mynus, t.y. tos paèios daþnumø katego-rijos þodþius.

Daþniniai sàraðai yra conditio sine quanon rengiant þodynus, nes tik remiantisþodþiø daþnumu galima atlikti pirminæþodþiø atrankà. Èia labiau tinka trum-pesni lemø sàraðai uþ ilgus nelemuotøþodþiø formø sàraðus, bet ir pastariejigali bûti pravartûs. Juos naudojant gali-ma apsiriboti tam tikru þodþiø formødaþniu atsisakant retesniøjø pavartoji-mo atvejø, nes daþnas þodis, kad ir ne-daug formø turëtø, vis vien kuria norspateks á virðutinæ, t.y. daþnøjø formøsàraðo, dalá.Nelemuotas sàraðas, kaip ir lemuotas,

gali bûti naudojamas sociopolitinei ana-lizei, nes ið þodþiø vartojimo daþnumogalima spræsti apie daugelá visuomenësgyvenimo dalykø. Tai ypaè akivaizdu,kai lyginami keli tokie sàraðai: arba a)tos paèios kalbos ir to paties tæstinio teks-tyno, bet sudaryti skirtingu metu, kadiðryðkëtø vëliau padaþnëjæ þodþiai, arbab) skirtingø tekstynø ar skirtingø kalbø.Lyginami sàraðai turëtø remtis teksty-nais, sudarytais panaðiais principais, kadduomenys bûtø patikimi.Dar vienas daþniniø sàraðø tipas, su-

darytas lyginimo pagrindu, yra prasmi-niø7 þodþiø sàraðas (key-word list), ið ku-rio iðryðkëja daþnesni nei tikëtina kon-kretaus teksto ar maþesnës tekstyno da-lies þodþiai. Lyginant viso, pageidauti-na kuo didesnio, tekstyno ir nedidelës jodalies þodþiø vartojimo daþnumus, á pir-mà vietà iðkyla maþesniosios jo daliestipiðki þodþiai, o visame tekstyne daþniþodþiai nueina á antrà planà. Taip gali-ma pamatyti þodþius, nusakanèius tiria-mojo teksto ar tekstø temà (plaèiau apieapatijos konkordanso daþniná ir prasmi-niø þodþiø daþniná sàraðà þr. 2.2.1.)Nelemuotas sàraðas, kad ir koks jis bû-

tø � visø þodþiø ar tik prasminiø, yrainformatyvesnis, nes, pavyzdþiui, Daþ-niniame þodyne pateikiama Lietuva ne-paaiðkina leksemos vartojimo daþnumo,o nelemuotame sàraðe daþniausia jos for-

1 lentelë

Nekaitomø þodþiø bei kaitomø þodþiøformø vartojimo daþnumas tekstyne

Þodþiø Þodþiø formø Vartosenosdaþnumas dalis dalis

> 10000 0,04% 37,36%

1000�9999 0,47% 27,33%

100�999 3,25% 21,24%

10�99 9,45% 9,94%

2�9 36,08% 3,09%

1 45,54% 1,04%

Page 16: Marcinkeviciene R. Tekstynu Lingvistika

2 2 KALBOTYRA INFORMACINEI VISUOMENEI

ma Lietuvos leidþia manyti, kad toká di-delá jos daþná lëmë vartojimas ávairiuosepavadinimuose, pvz.: Lietuvos Respubli-kos Seimas. Taigi ir ið nelemuoto tekstynosudarytas þodþiø sàraðas gali bûti pra-vartus, o jei reikia, jis gali bûti lemuoja-mas. Þemiau pateikiama to darbo eiga irsu ja susijæ sunkumai.

2.1.1. SÀRAÐO LEMAVIMAS

Kai kuriais atvejais, kai reikia informa-cijos apie atskiras tekstyno þodþiø gru-pes, pavyzdþiui, kalbos dalis, daþniná þo-dþiø sàraðà reikia lemuoti � atskiras kai-tomø þodþiø formas pakeisti jø lema, su-sumuojant þodþiø formø daþnius. Betprieð tai reikia atlikti daþninio sàraðosaraðo morfologinæ analizæ � anotuoti at-skiras formas. Abiem operacijoms buvonaudota Vytauto Zinkevièiaus lietuviøkalbos morfologinës analizës programa,trumpiau vadinama Lemuokliu (apie josveikimo principus þr. Zinkevièius 2000).Ði programa yra parengta keliø þodynøpagrindu, todël atpaþásta visas ðiuose þo-dynuose buvusiø þodþiø ðaknis ir lei-dþia iðvestines kaitomø þodþiø formasa) ávardyti, t.y. morfologiðkai analizuo-ti, ir b) priskirti antraðtinëms formoms,arba lemoms. Taip gaunamas lemø sàra-ðas su atskirø kalbos daliø paþymomis,o ðalia lemø pateikiamos visos þodþiøformos, ið kuriø buvo gauta lema.Lemavimui imamas ne visas bendrasis

sàraðas, o tik tie jo þodþiai ir þodþiø for-mos, kurie visame tekstyne buvo pavar-toti bent du kartus. Toká apsisprendimàlemia vienakarèiø formø saraðo daliesanalizë, parodþiusi, kad èia gausu ko-rektûros klaidø, okazionalizmø, retø þo-dþiø ir pan. Bent kiek áprastesniø þodþiøformos paprastai patenka uþ didesniodaþnio ribos, taigi ir tarp lemø. Reèiau-siai vartojamø þodþiø formø ignoravi-mas remiasi dar ir nusistovëjusia prakti-

ka, leidþianèia neatsiþvelgti á 1�2 kartuspavartotus þodþius ar jø formas kur kasmaþesniuose tekstynuose nei mûsiðkis.Neanotuoto tekstyno daþninio þodþiø sàra-ðo morfologinë analizë kelia ðiokiø tokiøproblemø. Pirmiausia susiduriama su auto-matinës kalbos analizës didþiausiu kliuvi-niu � homonimija. Daþnas bendrojo sàraðonekaitomas þodis ar kaitomojo þodþio formagali bûti interpretuojama keleriopai, plg. kar-tø ið daiktavardþiø karta, kartas, bûdvardþiokartus, dalyvio kartas. Remdamasis dvejopaar trejopa morfologine anotacija, lemuoklisgeneruoja kelias lemas. Kuri ið interpretacijøyra teisinga, kiekvienu konkreèiu jos pavar-tojimo atveju galima pasakyti tik remiantiskontekstu. Jei bûtø anotuojamas tekstas, one atskirø formø sàraðas, ðià problemà galë-tø iðspræsti þmogus. Taèiau eksplikuoti ið sà-raðo paimtus lietuviø kalboje itin daþnus ho-monimus ir homoformas keliasdeðimties mi-lijonø þodþiø tekstyne yra visai nerealu, oprograminës sintaksinës analizës priemonës,leidþianèios tà padaryti tegu ir netobulai,bet automatiðkai, dar nesukurtos. Todël rei-kia tenkintis daline iðeitimi� sàraðo lemavi-mu, iðrenkant ið jo visus þodþius, galinèiuseiti rûpima kalbos dalimi, pvz., daiktavar-dþiais ar veiksmaþodþiais. Taigi homonimøatveju á daiktavardþiø sàraðà patenka visitie, kurie turi bent vienà daiktavardinæ inter-pretacijà. Tokie galimai homonimiðki þodþiaisudaro nemenkà daiktavardþiø sàraðo dalá.Kadangi jie patenka su bendru, t.y. ir kitøhomonimø daþnumu (atskirti daiktavardiniøðiø formø vartosenos atvejø daþnumà bûtøgalima tik perþvelgus visus, paprastai labaigausius, jø pavartojimo atvejus, o tà padary-ti vëlgi visai nerealu), tai daþnai atsidurianepamatuotai aukðtai sàraðe, pvz., sakë yravienas ið daþniausiø lemuoto sàraðo daikta-vardþiø ne todël, kad Lietuvoje bûtø popu-liari ði japoniðka degtinë, o dël daþnai varto-jamos homoniminës veiksmaþodþio sakyti bû-tojo kartinio laiko formos. Taip pat ir lemaporas, sutampantis su pora.

Galima paminëti kai kurias kitas daþnas ho-moformas, kai a) sutampa daiktavardþio irveiksmaþodþio formos: taikos, atsako, lietø,sektø, pamato, baigtis, kartos, nerimo, giria, rû-ko, negalios, vytis, mina, grotø, palaikai, karsto,kartos, laimës, iðkyla, naudos, paieðkos, uosto,laidos, padaro, vargo, pastato, ðneka, jungtis,etc. b) sutampa bûdvardþio ir daiktavardþioformos: tankø, deðimtmeèius, tikslus, pajëgø,þenklø, objektyvus, atlaidus, giliø, daliná, tau-

Page 17: Marcinkeviciene R. Tekstynu Lingvistika

2 3Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

rus, etc. Atskiras atvejis � visi daiktavardþioir bûdvardþio linksniø sinkretizmo atvejai:apatija, ambicija � vienaskaitos vardininkas iránagininkas, iðvados, priemonës � vienaskai-tos kilmininkas ir daugiskaitos vardininkasir pan. Èia priklauso visomis savo formomissutampantys sudaiktavardëjæ bûdvardþiai:rankinis, mënesinës, laukinis, eilinis, elektrinë,pieninë, stiklinë ir dar daugelis kitø daþnoshomonimijos atvejø, kuriems iðsamiai aptar-ti reiktø atskiros studijos.

Minëti daiktavardþiai yra visai tikëtini da-bartinës lietuviø kalbos tekstyne, nors ir netokie daþni. Taèiau gautame daiktavardþiøsàraðe esama ir tokiø þodþiø, kuriø galimybëbûti pavartotiems pastarojo deðimtmeèiotekstuose kelia dideliø abejoniø, pvz.: aikðtis(uþgaida) artis (artumas), baisis (baisumas,baimë), balda (trankymasis), baugas (baidyk-lë), brangis (brangumas), budis (lakðtaþiedþiøðeimos grybas), daiga (dygimo laikas), deja(vargas), dusas (dusulys, astma), ëja (ëjimas),fotas (apðviestumo vienetas), gaudë (mëðlinëmusiukë), giedris (giedrumas), girdas (þinia,gandas), graudis (graudumas), guda (baidyk-lë paukðèiams ið javø baidyti), gulas (iðvirtæsmedis) ir pan.

Visi ðie nurodyti ir á juos panaðûs daiktavar-dþiai yra perimti ið Dabartinës lietuviø kalbosþodyno (toliau � DLKÞ), kuriuo remiasi le-muoklis ir generuoja visà jø kaitybinæ para-digmà. Taèiau patikrinus, ið kokiø konkreèiøformø buvo gautos ðios lemos, paaiðkëjo, kadbûtent ið homonimiðkøjø, t.y. tokiø, kuriosyra bendros ir kitoms kalbos dalims (bûd-vardþiams, veiksmaþodþiams, jaustukams,prieveiksmiams) ar kitiems nei nurodytiejipamatiniai daiktavarþiaims: brangis � ið ðiøsutampanèiø formø brangiai, brangi, brangiø,brangius, brangiai, brangiu, brangiuose, bet neið brangio, brangiui, brangá, brangyje; fotas � iðvienintelës bendros su nekaitomu daiktavar-dþiu formos foto; gaudë � ið vienintelës ben-dros su veiksmaþodþiu gaudyti formos. Taigiir graudis yra per homonimiðkà formà grau-dþiai supainiojamas su prieveiksmiu graudþiaiar bûdvardþio graudi vienaskaitos naudinin-ku, kitaip sakant, daiktavardþiui lemuoklispriskiria homonimiðkas kitø kalbos daliø arkitø pamatiniø daiktavardþiø formas. Labaitikëtina, kad gulas yra generuotas dël sutapi-mo su veiksmaþodþiu gulëti, ëja � su eiti perhomonimiðkà formà ëjai, o daiga su daigais.

Dël homonimijos atsiradusi lemuoklio pa-klaida átraukia á tekstyno daiktavardþiø sà-raðà realiai tekstuose nebevartojamus þo-

dþius vien todël, kad jie yra pateikti DLKÞkaip dabartinës kalbos þodþiai, apsunkinatekstyno ir þodyno daiktavardþiø lyginimà,nes tekstyno daiktavardþiø sàraðà reikia tik-rinti ir þiûrëti, ið kokiø formø yra iðvestostenai nurodytos lemos.

Dar kebliau yra susidûrus su kita dëlhomonimijos atsiradusia automatinësmorfologinës analizës problema � vadi-namaisiais nerealiais daliniais homoni-mais. Èia turime reikalo su formaliai eg-zistuojanèiais, bet realiai kalboje nevar-tojamais dariniais, kuriuos programa ge-neruoja ið savo duomenø bazëje turimøðaknø ir afiksø. Sulemuotame daiktavar-dþiø sàraðe buvo rasta visa grupë tokiødaiktavardþiø. Èia priklauso: aplankytis,apraðytis, apsakytis, atlaikytis, blaðkytis, gin-èytis, pastatytis ir panaðûs dariniai. Jieyra atsiradæ dël darybiðkai galimø ma-þybiniø formø ðauksmininko linksnio iðpamatiniø daiktavardþiø aplankas, apra-ðas, ginèas, pastatas. Programa, aptikusiðauksmininko formas, sutampanèias suveiksmaþodþiø bendratimi aplankyti, ap-sakyti, atlaikyti, pastatyti, jas interpretuo-ja dvejopai, o atskyrus daiktavardinesinterpretacijas nuo visø kitø, neegzistuo-jantys þodþiai patenka á daiktavardþiøsàraðà. Perþiûrint sàraðà, jie braukiami.Taigi su minëtø trijø grupiø homonimais�tikëtinais, neátikëtinais ir nerealiais � el-giamasi nevienodai: pirmieji paliekami,nors ir ne visai tinkamoje jiems pagaldaþnumus vietoje, o kitø atsisakoma, ne-átikëtinus patikrinus pagal iðvestines for-mas, o nerealiuosius ið karto trinant iðsàraðo.Esama ir kitø dël homonimijos atsira-

dusiø lemavimo keblumø, kuriuos derë-tø iðanalizuoti atskirai. Tuomet bûtø vertanurodyti ir galimus homonimijos iðaið-kinimo automatiniame lemuoklyje bûdus.Èia tik norëta pristatyti paèià problemàir parodyti, kad ten, kur ámanoma, dëldalinës homonimijos atsiradusiø nevar-tojamø þodþiø buvo bandyta atsisakytineprograminëmis priemonëmis. Absoliu-

Page 18: Marcinkeviciene R. Tekstynu Lingvistika

2 4 KALBOTYRA INFORMACINEI VISUOMENEI

èiosios homonimijos, pvz., auksinis þie-das � gëlës þiedas, neámanoma aptikti netik pavieniø þodþiø sàraðe, bet ir morfo-logiðkai anotuotame tekstyne. Jiems eks-plikuoti bûtina semantinë teksto anota-cija. Apibendrinant lemavimo etapà, ga-lima teigti: nors atskirø formø lemavi-mas ir kelia homonimijos problemø, ta-èiau tam tikrais atvejais, nelygu lemavi-mo tikslas, jis gali bûti pakankama irpatenkinama automatinës analizës prie-monë. Atsiþvelgus á tekstyno duomenisir patobulinus lemuoklá, galima pasiektikur kas geresniø rezultatø.

2.2. KONKORDANSAS

Dar 1991 metais pasirodþiusioje monogra-fijoje �Tekstynas, konkordansas, koloka-cija� J.Sinclairis siûlë tokià atskiros lek-semos tyrimo tekstyne procedûrà. Pir-miausia generuojamas konkordansas, t.y.gaunami visi atskirø leksemos formø var-tojimo atvejai minimaliame vienos eilu-tës kontekste, þodþiø formos iðrikiuoja-mos daþnumo tvarka. Po to eilutës trum-pinamos, paliekant tik su tiriamàja for-ma susijusius þodþius. Anglø kalboje op-timalus þodþiø kiekis á kairæ ir á deðinænuo tiriamosios formos yra penki þodþiai.Ðie þodþiai visame konkordanse yra trak-tuojami kaip tekstas, kuriam generuoja-mas þodþiø daþnumø sàraðas. Taip gau-nami maþëjanèio daþnio tvarka iðrikiuo-ti visi tiriamojo þodþio konteksto part-neriai. Ðis sàraðas trumpinamas, papras-tai atsisakant paskutiniojo jo deðimtada-lio, mat reti, vienkarèiai junglumo part-neriai nëra ádomûs, jie neatspindi tipið-kos vartosenos atvejø. Likusiai sàraðodaliai skaièiuojamas svarbos koeficien-tas tiriamojo þodþio atþvilgiu: lyginamasjo daþnumas visame tekstyne ir duotaja-me konkordanse. Taip visame tekstynedaþnai vartojami þodþiai nusileidþia á sà-raðo galà, o specifiniai, tik tam konkor-

dansui bûdingi, � pakyla á virðø. Pagalkolokatø tipiðkumà konkordanso eilu-tës perrikiuojamos taip, kad tiriamojoþodþio junginiai su jam bûdingiausiaiskolokatais atsidurtø virðuje. Èia auto-matinë konkordanso analizë baigiasi, irprasideda lingvisto darbas: surasti ti-piðkas frazes, sintaksines struktûras, at-skirø daugiareikðmiø þodþio reikðmiøvartojimo atvejus ir pan. (Sinclair1991:105�106).1996 metais pasirodþiusiame straips-

nyje �Reikðmës vieneto paieðkos�, ku-riame analizuojami keliø þodþiø ir þo-dþiø junginiø konkordansai, á pirmà vie-tà iðkeliamas ne daþninis þodþiø sàra-ðas, bet pats konkordansas, tiesa, nedi-delis. Jis analizuojamas ið eilës þiûrint ávisas leksemø pozicijas á kairæ nuo tiria-mojo þodþio, pradedant nuo artimiau-sio, pirmojo ið kairës. Aptarus daþniau-siø ðià pozicijà uþimanèiø leksemø gra-matikà ir semantikà, judama tolyn á kai-ræ, kol apþvelgiamas visas artimasis pen-kiø pozicijø kontekstas, nustatomos ið-plëstinio leksinio vieneto leksinës, gra-matinës, semantinës ir pragmatinës sa-vybës (plaèiau apie jas þr. Tognini Bo-nelli 2000). Èia daþnumai nurodomi tikkiekvienai atskirà pozicijà uþimanèiai lek-semai. Taigi daugiau remiamasi konkor-danso analize, daþnumø þiûrint tik at-skirais vartosenos atvejais, pvz., nakedeye analizës atveju nurodoma, kad pir-mas ið kairës apytiksliai 95% visø varto-jimo atveju yra þymimasis artikelis the(Sinclair 1996:85).Suprantama, visai kitos struktûros nei

lietuviø kalba anglø kalbai tinka savi darbosu konkordansu metodai. Kur kur grieþ-tesnë þodþiø tvarka sakinyje, þymiai ma-þesnë þodþio gramatiniø formø ávairovë,labiau sustabarëjusi þodþiø junginio arfrazës struktûra lemia kitokià darbo eigà.Tad lietuviø kalbos konkordansai anali-zuojami kiek kitaip, èia ir bus pateiktavienos leksemos analizës eiga ir rezultatai.

Page 19: Marcinkeviciene R. Tekstynu Lingvistika

2 5Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

2.2.1. APATIJA � VIENOS LEKSEMOS

ANALIZË

Darbui su konkordansu pailiustruoti buvopasirinkta nedaþnai vartojama leksema,kad bûtø galima atlikti iðsamià analizæir aptarti visus jos vartojimo atvejus, ku-riø 60 milijonø þodþiø tekstyne buvo rasta268. Nedaþnas þodis buvo pasirinktas irdël kitos prieþasties: rûpëjo pasiþiûrëti,ar ir reèiau vartojamø leksemø ryðiai sukontekstu tokie pat svarbûs jø semanti-kai (þr. 3.4.2.).Darbo su apatijos konkordansu eiga buvo

tokia: ið pat pradþiø konkordansas buvoiðvalytas � nutrinti su tiriamuoju þodþiunesusijæ konkordanso eilutës galai, kitøsakiniø nei to, kuriam priklauso tiria-masis þodis, pabaigos ir pradþios. Ði ope-racija nëra bûtina ir dideliam konkor-dansui net ir sunkiai pritaikoma, taèiaujà atlikus gaunami tikslesni ir ðvaresnidaþniniai sàraðai.Antrajam etapui buvo naudojama tekstø

analizës programa WordSmith Tools, jaið iðvalyto konkordaso buvo sudaryti duþodþiø dàraðai: daþninis visø konkor-danso þodþiø sàraðas ir daþninis pras-miniø þodþiø sàraðas. Daþniniame sàra-ðe buvo 1447 þodþiai � tokia viso tiria-mojo konkordaso apimtis. Ið jø 1130 þo-dþiø pavartota tik vienà kartà, 176 þo-dþiai � du kartus, 87 þodþiai � tris kar-tus, ir t.t.Kaip matome, konkordanso þodþiø vartoji-mo daþnumo dinamika yra labai panaði áteksto ar tekstyno, tik vienkarèiø þodþiø for-mø pavartojimo atvejø konkordanse yra kurkas daugiau nei tekstyne, net 78% (plg. teks-tyne � 45.54 procentø). Be to, didesnis skir-tumas tarp retai ir daþnai vartojamø þodþiøformø: daþniausias þodis ir vartojamas 141,apatija � 124 (èia áeina formaliai sutampantisvardininkas ir ánagininkas), apatijos � 58, apa-tija � 54 kartus, po to daþnumo kreivë staigakrinta þemyn, ir ðeðioliktas pagal daþnumàþodis apatijai jau yra vartojamas tik 10 kar-tø. Tarp deðimties daþniausiai ðiame kon-kordanse vartojamø þodþiø patenka keturidaþniausi apatijos linksniai: vardininkas, ga-

lininkas, kilmininkas ir naudininkas. Ðiuoskonkordanso þodþiø vartojimo skirtumus ne-sunku paaiðkinti, nes konkordansas juk nëratekstas, jis sudarytas iðrenkant visus tiria-mojo þodþio vartosenos atvejus, tad jie drau-ge su keliais kitais itin daþnais þodþiais irformuoja kreivës virðûnæ. Tarp jos ir vien-karèiø þodþiø formø yra nedidelis sàraðo in-tervalas (tarp 16 ir 317 þodþio ið eilës), kuria-me ir reikia ieðkoti ambicijos kolokatø. O jø,net ir atmetus tarnybinius þodþius, ávardþiusir skaitvardþius, veiksmaþodþio bûti formas,bûta daug ir ávairiø. Þemiau pateikiamos tosprasminiø þodþiø formos, kurios yra pavar-totos nuo deðimties iki dviejø kartø.

GALI 10, APIMTI 9, VISUOMENËS 9, AP-IMA 8, LIETUVOJE 8, SILPNUMAS 8, KAR-TAIS 7, LIETUVOS 7, BENDRAS 6, DEPRE-SIJA 6, NUOVARGIS 6, PRADEDA 6, ÞMO-NËS 6, APATIJOJE 5, APËMË 5, DEPRESI-JOS 5, VILTIES 5, POÞYMIAI 5, SUKELIA 5,VISIÐKA 5, ABEJINGUMAS 4, AISTROS 4,BÛDINGA 4, JAUSMAS 4, METØ 4, NUO-TAIKA 4, NUOVARGÁ 4, PASIREIÐKIA 4,PILIEÈIØ 4, PILIETINËS 4, SKAUSMAS 4,SUKELTI 4, SVARBIAUSIA, 4, VILTÁ 4, ÞMO-NËMS 4, ÞMONES 4, ANOREKSIJA 3, APIM-TAS 3, ASMENS 3, ATSIRADO 3, DAÞNAI3, DEPRESIJÀ 3, GALVOS 3, GILIAUSIÀ 3,GYVENIMO 3, ILIUZIJOS 3, IMA 3, IÐJU-DINTI 3, ÁVARO 3, KARTU 3, KITIEMS 3,KOMA 3, NEBEGALI 3, NEGALI 3, NENO-RAS 3, NEPASITIKËJIMAS 3, NERIMAS 3,NEVILTIS 3, NEÞABOTOS 3, NORI 3, NUO-BODULYS 3, PASIDUOTI 3, PILIEÈIUS 3,PILIETINË 3, POLITINÆ 3, POLITINËS 3,RINKIMØ 3, SLËGË 3, ÐIRDÁ 3, TAUTOS 3,VAKARØ 3, VIRSTI 3, VISIÐKAS 3, VI-SUOTINË 3, ÞMOGAUS 3.

Prasminiø þodþiø daþninis sàraðas kur kastrumpesnis, já sudaro tik 41 þodis, nuo patiesdaþniausio apatijos iki iðjudinti, pavartototris kartus. Prasminiø þodþiø sàraðe nebelie-ka visuose be iðimties tekstuose daþnø ir se-mantiðkai neinformatyviø tarnybiniø ir kaikuriø kitø þodþiø. Palyginimui pateikiamasvisas apatijos konkordanso prasminiø þodþiøsàraðas, ið kurio paaiðkëja, kad visi prasmi-nio sàraðo þodþiai yra ir daþniniame sàraðe,bet ne atvirkðèiai.

1 APATIJA 124, 2 APATIJOS 58, 3 APATIJÀ54, 4 APATIJAI 10, 5 NUSIVYLIMAS 13, 6APIMTI 9, 7 SILPNUMAS 8, 8APATIJOJE 5,9 APIMA 8, 10 DEPRESIJA 6, 11 NUOVAR-GIS 6, 12 NEPASITIKËJIMAS 3, 14 DEPRESI-JOS 5, 15ANOREKSIJA 3, 16 POÞYMIAI 5,17 ÁVARO 3, 18 VISIÐKA 5, 19 KOMA 3, 20

Page 20: Marcinkeviciene R. Tekstynu Lingvistika

2 6 KALBOTYRA INFORMACINEI VISUOMENEI

NEÞABOTOS 3, 21 PILIETINËS 4, 22 APËMË5, 23 NUOVARGÁ 4, 24 ABEJINGUMAS 4, 25BENDRAS 6, 26 NEVILTIES 5, 27 GILIAUSIÀ3,28 NUOBODULYS 3, 29 PILIETINË 3, 30VISUOMENËS 9, 31 ÞMONIØ 15, 32 ILIUZI-JOS 3, 33 DEPRESIJÀ 3, 34 PASIREIÐKIA 4,35 SUKELIA 5, 36 VISUOTINË 3, 37 NENO-RAS 3, 38 AISTROS 4, 39 BÛDINGA 4, 40SLËGË 3, 41 IÐJUDINTI 3.

Kyla klausimas, kaip pritaikyti ðiuossàraðus þodþio reikðmës analizei. Patyssavaime jie yra informatyvûs tik tiek,kad nurodo tiriamojo þodþio atskirø for-mø vartojimo daþnumus ir daþniausiusminimaliame jo kontekste esanèius jun-glumo partnerius, tiek absoliuèiai paë-mus, tiek ir santykinai, jei lyginsime suviso tekstyno kontekstu. Ðiuos junglumoparterius galima laikyti kolokatais ir iðjø semantikos susidaryti tik bendrà irlabai apytikrá vaizdà apie apimties kon-teksto temas, nes þodþiø tarpusavio ry-ðiø sàraðai neparodo. Taigi galima saky-ti, kad apatija yra vartojama ðalia kitøemocines bûsenas ar ligos simptomus reið-kianèiø daiktavardþiø, pvz.: nusivylimas,silpnumas, depresija, anoreksija ir pan., sujais besijungianèiø veiksmaþodþiø, pvz.:apima, sukelia, pasireiðkia, slëgë ir pan. Ðiuosesàraðuose dar galima áþvelgti ir visuo-meniná, politiná kontekstø pobûdá: pilie-tinæ, politinæ, tautos, rinkimø ir pan.Tolesnëje analizëje daþniniai sàraðai bu-

vo naudoti dviem atvejais: visø pirmasuskirstant visà konkordansà pagal at-skirus apatijos linksnius, o vëliau tiksli-nant pavieniø jos kolokatø vartojimo daþ-numus. Taigi konkordanso eilutës su kon-kreèiais kolokatais buvo skiriamos apati-jos linksniø formø viduje, o ne visamekonkordanse.Suvokiant formos ir reikðmës sàsajas

(þr. 3.2.4.), visas konkordansas buvo su-skirstytas á penkias dalis pagal linksniøformas: apatija, apatijai, apatijà, apatijoje,apatijos. Atliekant ðá darbà, buvo atsisa-kyta kompiuterio neteisingai ðiai lekse-mai priskirtos Apatijaus [Ipatijaus. � Red.

past.] soboro vartosenos. Èia reikia pasa-kyti, kad ið tekstyno renkant leksemaspagal ðakná, kaip kad ðiuo atveju apatij*,paprastai pakliûna kur kas daugiau pa-naðiø leksemø, pavyzdþiui, sudarinëjantminties konkordansà pagal mint* pakliusmintolas, mintuvai, minti ir pan. Ðiuo at-veju atsirado tik viena nereikalinga kon-kordanso eilutë. Be to, buvo iðtrintos iridentiðkos besidubliuojanèios eilutës, ku-riø visada pasitaiko ar dël programoskaltës, ar dël ið skirtingø ðaltiniø suplau-kusiø vienodø tekstø, pvz., vienodø El-tos ar BNS agentûrø praneðimø dauge-lyje laikraðèiø.Antrasis etapas � atskirti homonimið-

kas linksniø formas. Kadangi apatija yravienaskaitinis daiktavardis, tai sutapo tikvienaskaitos vardininko ir ánagininko for-mos. Jei analizei bûtume pasirinkæ ambi-cijà, dar bûtø reikëjæ rankomis iðrûðiuotiidentiðkas daugiskaitos vardininko ir vie-naskaitos kilmininko, t.y. apatijos, for-mas. Linksniø sinkretizmas yra nemen-kas kliuvinys, jei norima dirbti su atski-romis daiktavardþiø formomis, todël bû-tina nors ið dalies automatizuoti ðá rû-ðiavimo procesà.

Visas darbinis konkordansas be netin-kamø ir pasikartojanèiø eiluèiø, kuriøbuvo rasta 16, sudaro 252 apatijos varto-jimo atvejus. Linksniai, kaip matyti iðlentelës, vartojami labai netolygiai: do-minuoja vardininkas, tarpinëje padëty-je� kilmininkas ir galininkas, reèiau var-tojami linksniai ðiuo atveju yra naudi-ninkas, ánagininkas ir vietininkas.Apskritai kalbant apie linksniø varto-

jimo dinamikà, kitø, ir vienaskaita, ir dau-giskaita vartojamø daiktavardþiø anali-zës atvejais reikia pasakyti, kad labai aið-

2 lentelë

Apatijos linksniø formø pasiskirstymaskonkordanse

Vard. Kilm. Naud. Gal. Ánag. Viet.

110 58 10 54 14 6

Page 21: Marcinkeviciene R. Tekstynu Lingvistika

2 7Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

kiai skiriasi trys vartosenos tipai: daþ-na� paprastai kelis ðimtus atvejø apimantiatskirø linksniø vartosena, vidutinë � ke-liø deðimèiø ir reta keliø vienetø ar netir visai tekstyne nerastø linksniø varto-sena. Palyginimui pateikiame kitø 10 abst-rakèiøjø daiktavardþiø linksniø vartoji-mo proporcijas VDU lietuviø kalbos teks-tyne8 (þr. 3 lentelæ).Ið lentelës matyti, kad tarp daugiau

nei 10% visos atskirø þodþiø vartosenosatvejø (jie lentelëje paryðkinti) daþniau-siai kartojasi vienaskaitos vardininkas,kilmininkas ir galininkas bei daugiskai-tos kilmininkas, o kontrastas tarp daþnøir retø linksniø pakankamai didelis. Tadjei dirbama ne su visu konkordansu, oatsirenkamos tik kai kurios jo eilutës,pvz., kas treèia, kas deðimta ar pan., kaikuriø linksniø vartosenos atvejø darbi-niame konkordanse gali ið viso nepasi-taikyti. Taip atsitiko su daiktavardþiudarbas, kai ið viso 90 000 eiluèiø jo kon-kordanso buvo atsirinkta tik kas deðim-ta, tai nepateko vienaskaitos ánaginin-kas, daugiskaitos kilmininkas, galinin-kas ir vietininkas.Toliau dirbama su kiekvienos linksnio

formos failu atskirai, gilinantis á varto-senos ypatumus, klasifikuojant konkor-danso eilutes pagal gramatiná, leksiná arsemantiná tiriamojo þodþio konteksto pa-naðumà. Tiriamajam daiktavardþiui yralabai svarbus veiksmaþodis, o jo kartaisviena konkordanso eilutë neaprëpia, jisnepatenka á ekrano lange matomà eilu-

tës dalá. Tokiu atveju galima gráþti á visàtekstynà ir, pakartojus konkreèià pertrumpos eilutës paieðkà, gauti kur kasilgesná 1000 þenklø kontekstà. Galima to-kiø eiluèiø ir visai atsisakyti arba nau-doti jas kitiems, arèiau tiriamojo þodþioesantiems junglumo partneriams, pvz.,bûdvardþiams, kitiems daiktavardþiamsgauti. Daþnai veiksmaþodis nepakliûvaá eilutæ dël ilgo vienarûðiø sakinio daliøvardijimo, kurioms apraðyti ir galima nau-doti ðias defektyvias konkordanso eilu-tes. Nuo likusio konkordanso parankuatskirti ir a) antrinës nominacijos atve-jus, kai tiriami þodþiai eina pavadini-mais ir vardais (þr. 2 eilutë), b) þodþiøjunginiø forma turinèius tekstø pavadi-nimus (þr. 1 eilutë) bei c) ðiaip trumpussakinius, kuriø predikatas yra suvokia-mas ið konteksto (þr. 8 ir 11 eilutës).

Defektyviø apatijos vienaskaitosvardininko eiluèiø sàraðas1. Alfonsas Pilka. Rinkimø iðvakarëse: aist-ros ir apatija

2. Po jø grojo pusiau ðiaulietiðka, pusiau vil-nietiðka �Apatija�.

3. pirmo numerio redakcijos þody. Nusimi-nimas, nepasitikëjimas vienas kitu, apatija irnuobodulys. Skirtumà tarp ðiø dviejø pa-mokø lemia asmenybës

4. þmoniø izoliacija, susvetimëjimas, tapatu-mø praradimas, diskriminacija, apatija ir t.t.Nacionalizmas tarytum pasaulietinë moder-niøjø laikø religija

5. asepsiniai pleuritas, pneumonija, perikar-ditas, didelis bendras silpnumas, apatija,

3 lentelë

Kitø daiktavardþiø linksniø vartojimo dinamika tekstyne (procentais)

þodis V.V. V.K. V.N. V.G. V.Á. Viet. D.V. D.K. D.N. D.G. D.Á. Viet

aistra 12,8 8,8 1,7 7,9 3,7 0,1 33 16,8 2,8 11,8 0,3 0,3liûdesys 26 29 2 17 25 1 � � � � � �noras 30 13 1 22 13 � 4 10 1 5 1 0,02þinia 6,6 4,8 0,4 4 1,2 3,2 21,7 27,3 3,1 13,1 12,1 2,6valia 15,2 28,7 14,9 19,2 17,7 2,5 � � � 1,8 � �patirtis 25,8 26,9 0,3 27,0 19,5 0,05 � � � � � �melas 37,2 32,2 1,2 14,1 9,7 0,5 0,8 1,8 0,3 1,2 1,0 0,2propaganda 36 37 8,6 11 6,9 0,8 � � � � � �darbas 9,4 33,9 3,0 16,3 1,9 3,2 6,0 10,9 1,7 7,7 1,7 1,1

Page 22: Marcinkeviciene R. Tekstynu Lingvistika

2 8 KALBOTYRA INFORMACINEI VISUOMENEI

apetito stoka, troðkulys, galvos ir galûniøskausmas, ðleikðtulys,

6. vaikams, tiek suaugusiems: bloga nuotai-ka, savæs nevertinimas, kaltës jausmas, apa-tija, bendravimo sunkumai, suicidinës (savi-þudiðkos) mintys.

7. nenoras, nerimas, iliuzijos, nerealizuotijausmai, hormonø audros ir vël apatija. Ny-ku, kai visa tai susimezga á vienà kamuolá. Okur dar prikiðamai

8. Pasakymas: pats neþino, ko nori! � tikoman kaip niekam kitam. Jaunatviðka apatija.Pastangø bergþdumas. Pasaulinis liûdesys di-dþiojo Weltschmerz�o pa

9. ir gudrumas, skurdas ir iðlaidumas, pasiu-tæs linksmumas ir persisotinusio apatija...Toks lydinys dabar áþengë á Europà, brauna-si ir sustos tik prie

10. sakomybës jausmo, nesugebëjimas sava-rankiðkai màstyti ir dirbti, visiðka apatija...viso to prieþastis yra sovietinis fizinis ir dva-sinis genocidas

11. amø. Ji áëjo á savo kambará, lëtu judesiunumetë nuo savæs paltà. Visiðka apatija irabejingumas.

Gilinantis á kiekvienos linksnio formosvartosenà, buvo ieðkoma daþniausiai pa-sikartojanèiø konteksto elementø, nesvar-bu, kokie jie bûtø, � þodþiai, þodþiø gru-pës, gramatinës konstrukcijos ar kas ki-ta, taip atskiriant tipiðkus elementus nuonetipiðkø. Toliau ir aptarsime kiekvie-nos apatijos linksnio formos vartojimo ypa-tumus atskirai, ieðkodami tipiðkø ir pa-sikartojanèiø, su atskiro linksnio formasusijusiø vartosenos modeliø.

Predikatiniu ryðiu susijæ apatijoskolokataiVardininko konkordanse, þiûrint sintak-sinio apatijos vaidmens, iðryðkëjo dvi di-delës grupës. Vienoje jø apatija yra var-tojama su veiksmaþodþiais, kitoje � supredikatiniais daiktavardþiais, bûdvar-dþiais ar dalyviais. Kai apatija, eidamasakinio veiksniu, yra vartojama su veiks-maþodþiais, t.y. sudaro subjektinius jun-ginius, pirmiausia á akis krinta pati di-dþiausia 20 eiluèiø �apëmimo� veiksma-þodþiø grupë:

1. Ðirdyje ðiandien taip tuðèia. Mane vël ap-ima melancholija, apatija.

2. kità èeèënø bruoþà � optimizmà. Jis tei-gia, kad èeèënø negali apimti apatija.

3. paèiai kabintis á gyvenimà, siekti savotikslo, nors ir jà kartais apima apatija.

4. Virgà apëmë visiðka apatija. Kità dienà jipragulëjo bendrabuèio kambarëlyje,

5. uþmokestis sumaþëjo 2�3 kartus. Todëldidþiàjà gyventojø dalá apëmë apatija.

6. Juos gali apimti depresija, apatija, visið-kas neveiklumas. Be to, Mënulio

7. Bet kurá socialiná sluoksná gali apimti apa-tija, taèiau mûsø, kariø, jokiu bûdu.

Þvalgantis á didesná ðios neabejotinoskolokacijos apatija apima kontekstà, ko-kiø nors reguliarumø nepastebëta. Apa-tija gali apimti tiek pavienius asmenis,tuomet vartojamos savybiniø ávardþiø for-mos, tiek ir platesnius gyventojø sluoks-nius, plg. pilieèius, didþiàjà gyventojø dalá,didþiàjà dalá visuomenës, bet kurá socialinásluoksná. Pats tiriamasis daiktavardis pa-prastai vartojamas be paþyminio, tik vienuatveju pavartotas stiprinamasis þodis vi-siðka, o kitu � socialinë, su juo besijun-giantis veiksmaþodis gali eiti ávairiomisformomis: apima, apëmë, apimtø, apimti,apims. Be abejo, tolimesnio nei vienas ko-lokatas konteksto ar kolokatø formø ávai-rovei tirti reikia kur kas didesnio kon-kordanso, kuriame labiau galëtø iðryð-këti galimi vartosenos dësningumai.Kitos su subjektiniø junginiø apatija ei-

nanèios veiksmaþodþiø grupës jau susi-deda nebe ið vieno, bet ið keliø sinoni-miðkø veiksmaþodþiø, tai 13 vartojimoatvejø su kitais veiksmo pradþios veiks-maþodþiais � apimti sinonimais (apniks,ateina, atsirado, pasijuto, pasireiðkia, prasi-deda, uþeina, uþgriuvo), 11 �varginimo� (galiapsunkinti, grauþia, ima kankinti, pakirto jë-ga, slëgs, slëgë, vargino, þlugdo), 6 �vieðpa-tavimo� (vyrauja, vieðpatauja, uþvaldo) ir 5�augimo� (augo, didëja, padidës, sustiprëjo)veiksmaþodþiais. Atskirà grupæ sudarodar 10 ávairios reikðmës veiksmaþodþiø,tokiø kaip atauðinti, jaustis, grësti, patikti,nykti, pakeisti, skatinti, virsti, tvyroti.

Page 23: Marcinkeviciene R. Tekstynu Lingvistika

2 9Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

Apibendrinant su apatijos vardininkuvartojamø veiksmaþodþiø semantikà, ga-lima pasakyti, kad apatija kolokuoja sudaþniausiai vartojamu veiksmaþodþiu ap-imti bei jam sinonimiðkais veiksmo pra-dþios, �atsiradimo� veiksmaþodþiais, josstiprëjimà bei vyravimà þyminèiais ne-konotuotais ir neigiamà jos poveiká ávar-dijanèiais konotuotais �varginimo� veiks-maþodþiais. Kitaip sakant, apatija yra tas,kas apima, auga, uþvaldo ir slegia þmo-gø, þmones ar tautà. Pastaroji apatijos var-tosena iðryðkëja ið tranzityviniø veiks-maþodþiø valdomø objektø semantikos,pvz., apatija ir kitos blogybës toliau grau-þia þmogaus ir valstybës pagrindus. Draugesu netranzityviniais veiksmaþodþiais ei-nantis lokatyvas þymi tokias apatijos pa-plitimo vietas: kraðtà, miestà, kaimus irmiestelius, daþnai minima Lietuva pvz.,Lietuvoje vieðpatauja nusivylimas, apatija.Dvejopà: asmeninæ ir visuomeninæ apa-tijos paplitimo sferà nurodo ir nedaþnisu apatijos vardininku einantys bûdvar-dþiai: be jau minëtø, visiðka, socialinë, darir pilietinë, politinë.Antras stambus apatijos vardininko var-

tosenos sintaksinis modelis apima tuosdvipusës sàsajos ryðiu susijusius kopu-liatyvinius junginius (Labutis 1998:62),kai apatija eina a) tarinio vardine dalimiarba b) veiksniu, kurio sudurtiná tarinásudaro dalyviai, bûdvardþiai, daiktavar-dþiai. Kitaip sakant, ðiais modeliais nu-rodoma, kas ir kokia yra apatija.a) vienas pagrindiniø ðiø rinkimø bruoþø yradidëjanti pilietinë apatija; Dekompensuotosacidozës simptomai yra bendras silpnumas,mieguistumas, apatija, galvos skausmas, so-poras; Politinë apatija � irgi praeities pavel-das; O apatija � natûrali reakcija á perdëtàjaudinimàsi; Reakcija á tai yra apatija arbaradikalëjimas; Ðiø metø apklausos parodë,kad nusivylimas ir apatija tapo paèia di-dþiausia mûsø nelaime;

b) jauèiama visuotinë apatija; kalta visuoti-në apatija; jaunimui vis labiau bûdingas so-cialinis infantilizmas, socialinë apatija; kamnaudinga apatija, tautos nusivylimas;

Pabrëþiamas daugelio þmoniø nusivylimasir slegianti apatija; Juk dabar ásivyravusi to-kia apatija; á atvirà tautiná nihilizmà perau-ganti pilietinë apatija;

Ðiø modeliø viduje ryðkesniø leksiniøar semantiniø tendencijø, atskirø þodþiødaþnesniø pasikartojimo atvejø nepaste-bëta, èia vartojami dalyviai atkartoja pir-mojo modelio veiksmaþodþius: ásivyra-vusi, perauganti, slegianti, bûdinga, jauèia-ma, paþyminiais einantys bûdvardþiai yratie patys: socialinë, pilietinë, politinë, vi-suotinë. Taigi ið esmës 24 eiluèiø konkor-dansas pakartojo tas paèias leksines irsemantines subjektinës apatijos veiksma-þodinio konteksto (bendra apimtis � 65eilutës) ypatybes, besiskirianèias daugiau-siai gramatine raiðka.Kilmininko konkordanse (58 eilutës)

taip pat iðryðkëjo keli ryðkesni tiriamojoþodþio vartosenos ypatumai, pirmiausia�atributiniai junginiai su daiktavardþiais�20 eiluèiø, kuriuose apatija eina kilmi-ninko linksniu dviþodþiame ar ir dides-nës apimties þodþiø junginyje:apatijos ir beprasmybës iðgyvenimø, bendraiapatijos ir indiferentiðkumo nuotaikai, apa-tijos ir átarumo pritvinkusios atmosferos,apatijos ir motyvacijos stokos, apatijos irnusivylimo marðkà, politinës apatijos ir pa-syvumo metø, apatijos ir pavargimo laikais,abejingumo ir apatijos jûra, didþiausios po-litinës apatijos laikotarpiu, apatijos ledai,pilietinës apatijos luobu, apatijos nirvanosbangose, visoje Lietuvoje dominuojanèià apa-tijos nuotaikà, pilietinës apatijos poþymiø,melancholiðkas apatijos vëjas, apatijos, abe-jingumo, nevilties bûsenà, apatijos, depresi-jos, nusivylimo poþymiai, ið apatijos liûno.

Èia, kitaip nei vardininko linksniu var-tojamai apatijai, nebereikia viso sakiniomodelio, uþtenka þodþiø junginio, o svar-biausias yra tiesiogiai su apatija susijæsdaiktavardis � poþymiai, bûsena, laikai, etc.Dar svarbûs yra apatijos paþymimieji þo-dþiai, pvz., didþiausios politinës apatijoslaikotarpis bei kiti þodþiø sàjungos, t.y.vardijimo nariai, paprastai apatijos si-nonimai arba kohiponimai: depresija, nu-

Page 24: Marcinkeviciene R. Tekstynu Lingvistika

3 0 KALBOTYRA INFORMACINEI VISUOMENEI

sivylimas, abejingumas, neviltis, pasyvumas,pavargimas, átarumas, indiferentiðkumas, etc.Pastarieji iðryðkëja ið visais linksniais var-tojamos apatijos ir yra vienas tipiðkiau-siø ðio þodþio vartojimo kontekstø.Kalbant apie ðiø daiktavardiniø þodþiø

junginiø semantikà, bûtina nurodyti dvipagrindines daiktavardþio reikðmiø gru-pes: tiesioginës ir perkeltinës reikðmësdaiktavardþius. Pirmieji nurodo laikà, po-þymius bei apatijos hiperonimus: bûsenà,nuotaikà, iðgyvenimus, antrieji, metafori-niai, yra labai ávairûs: ledai, luobas, marð-ka, jûra, bangos, liûnas, vëjas. Pirmieji trysjunginio daiktavardþiai nurodo bendrà�apatijos � kaustanèio ar dengianèio ap-valkalo� metaforà, plg.: praplëðdami Lie-tuvà apgaubusià apatijos marðkà, o pasta-rieji, iðskyrus vëjà, þymi �apatijos � van-dens� metaforà.Kitas struktûrinis kilmininko vartose-

nos vienetas � atributiniai apatijos jungi-niai su dalyviu (11 eiluèiø) apimtas/a, kurapatija eina paþymimuoju þodþiu, o nepaþyminiu, gramatiðkai reikalaujanèiukilmininko linksnio, bet semantiðkai tikpakartojanèiu vardininko vartosenà suapimti: Kraðtas apimtas depresijos, apati-jos, nevilties alkoholizmo; Bet ar ji patikës,apimta tø kompleksø, apatijos ir pesimiz-mo; Þmonës pradeda prarasti viltá, yra ap-imti apatijos, labai iðsekæ emociðkai.Treèias apatijos kilmininko vartosenos

modelis yra objektinio junginio prielinks-ninë ið konstrukcija (8 eilutës), vartoja-ma su dviem metaforiniø veiksmaþodþiøgrupëmis, suponuojanèiomis �apatijos �miego� (paþadinti miesto visuomenæ, iðju-dinti þmones, atbusti, atsibusti) ir �apati-jos� nelaisvës� (vaduotis, iðsivaduoti) me-taforas.Tarp 18 ávairiø arba neklasifikuotø kon-

kordanso eiluèiø galima rasti dël grama-tiniø linksnio valdymo prieþasèiø atsi-radusius objektinius apatijos vartosenosatvejus, nesudaranèius atskirø semanti-niø grupiø. Èia priklauso a) prielinksni-

nës konstrukcijos su dël, nuo, prie, tarp, b)kilmininko reikalaujantys veiksmaþodþiaiprisidëti, atsikratyti bei c) neiginiai netu-rëtø skatinti ir pan.Naudininko konkordansas yra nedi-

delis, tik 10 eiluèiø, ir 8 ið jø yra nepasi-duoti, pasiduoti vartojimo atvejai: paragi-no Lietuvos þmones ir svetur gyvenanèiuslietuvius nepasiduoti apatijai; pranaðavo pa-vasará, gaivino viltá, neleido pasiduoti visið-kai apatijai. Èia ir vël regime gramatiniolinksniø valdymo atvejá, o veiksmaþo-dis, nors ðalia kitø apatijos linksniø irneaptinkamas, taèiau semantiðkai nëraunikalus, nes kartoja jau vardininke irkilmininke rastà �apatijos � nelaisvës� me-taforà, plg.: iðsivaduoti ið apatijos, apatijauþvaldo.Galininko konkordansas (54 eilutës)

pasiþymi trimis aiðkiais veiksmaþodþiø,kuriø papildiniu eina apatija, tipais: tai�puolimo á apatijà�, �apatijos sukëlimo�ir �apatijos paðalinimo� veiksmaþodþiai.Ið �puolimo� veiksmaþodþiø patys daþ-niausi yra grimzti, pavartotas 3 kartus,pulti � 2 kartus ir patekti, áslysti, kristi povienà kartà: Po truputá grimzdau á siaubin-gà apatijà; Bet juk ir jaunas puola á apati-jà; Ir taip jis áslysta á pasyvumà, á ðalinimàsiir apatijà; Mieþelaitis buvo puolæs á dar di-desnæ apatijà.17 �apatijos sukëlimo� veiksmaþodþiø gru-pës nariai pasiskirsto taip: sukelti � 8 kartai,stumti � 3, gramzdinti � 2, atneðti, paskleisti,paskatinti, varyti � po vienà kartà: Nepasitikë-jimas stumia á apatijà; Juoda ir tamsiai pilkadidina mieguistumà, sukelia apatijà; be galosunki padëtis stumia á neviltá, apatijà; Ilgaitrunkantis skausmas gali sukelti apatijà, depre-sijà, miego sutrikimus; Tas nusimanymas gramz-dino já á apatijà ir slëgë poetinius jo vaizduotëspolëkius.

Prieðingos reikðmës �apatijos paðalini-mo� veiksmaþodþiai (7 eilutës) yra lek-siðkai ávairûs, tik vienas jø � paðalinti �pavartotas 2 kartus, o kiti ávairuoja: Gal-bût tatai ir iðblaðkë já apëmusià apatijà; vi-taminai, ðalinantys apatijà, nuovargá, ne-

Page 25: Marcinkeviciene R. Tekstynu Lingvistika

3 1Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

migà; Ðalin apatijà, neveiklumà, �oblomov-ðèinà!; nuovargá, apatijà ir neþinia ið kuratsiradusá irzlumà kaip ranka nuims.17 eiluèiø grupæ sudaro ávairios seman-

tikos veiksmaþodþiai, jie yra plaèiai var-tojami ávairiuose kontekstuose ir tipiðkøbei daþnø junginiø su tiriamuoju þodþiunesudaro: paaiðkinti, vertinti, pakeisti, jausti,iðgyventi, spræsti apie/ið, atspindëti.Ánagininko konkordansas (14 eiluèiø)

leksiðkai ir semantiðkai labai ávairus, jun-giamas tik linksnio formos ir sintaksinësobjektiniø junginiø semantikos, todël èiaplaèiau neaptariamas, tik iliustruojamas:Ji pasireiðkia apatija, depresija, kartais �agresijos plyksniais; pasaulio abejingumas Èe-èënijai gali virsti apatija; Tai problema, ku-ri tiesiogiai susijusi su þmoniø socialine apa-tija, dorovine degradacija, politiniu stabilu-mu ir pan.; kaltina iðsivadavusius ið totalita-rizmo valstybiø pilieèius abejingumu ir apa-tija; Apsivylimu ir apatija pripildo jojo ðirdá,kuri po to svajoti nebegali.Vietininko konkordansas (7 eilutës)

nors ir nedidelis, bet panaðiai kaip irnaudininko atveju, sudarytas ið vieno þo-dþio skæsti vartojimo atvejø. Vienà kartàpavartotas merdëti, kurá galima laikytiskæsti sinonimu: Lietuvos þmonës ðiandienskæsta varge, apatijoje ir alkoholyje; Tadamûsø visuomenë nemerdëtø visiðkoje apa-tijoje, depresijoje; Tie, kurie skendi apati-joje, ko gero, tokie ir iðeis á pensijà, � nepa-tenkinti, neprisitaikæ.Aptariant atskirø apatijos linksniø var-

tosenà, buvo þiûrima tiesioginiu sintak-siniu ryðiu su tiriamuoju þodþiu susiju-siø kontekstiniø partneriø, bandoma nu-statyti, ar yra koks ryðys tarp apatijoslinksniø ir artimiausiø jos kolokatø se-mantikos. Kadangi daiktavardþiui yra bû-tiniausi veiksmaþodþiai bei predikatið-kai vartojami dalyviai, bûdvardþiai ir kitidaiktavardþiai, tai jie pirmiausia ir buvotirti, klasifikuoti. Èia iðryðkëjo keliø links-niø ir veiksmaþodiniø kolokatø sàsajos:su gausiausiu apatijos vardininko links-

niu einantys veiksmaþodþiai sudarë ke-turias semantines grupeles, ið kuriø daþ-niausi ir leksiðkai ávairiausi buvo veiks-mo pradþios veiksmaþodþiai. Vienas jø�apimti � yra neabejotinai svarbiausias apa-tijos kolokatas. Objektinë apatijos varto-sena taip pat pasiþymëjo trimis ryðkio-mis semantinëmis veiksmaþodþiø gru-pëmis. Ið reèiau vartojamø apatijos links-niø tik naudininkas ir vietininkas iðsi-skyrë tipiðka leksine veiksmaþodþiø raið-ka, o kiti � naudininkas ir kilmininkas �pasirodë gana margi, iðskyrus daiktavar-dinius þodþiø junginius su apatijos kil-mininku, sudaranèius monolitiðkà atri-butiniø junginiø vartosenos tipà.Galima teigti, jog apatijos linksniø for-

mos yra valdomos su ja einanèiø tiesio-giniu ryðiu susijusiø þodþiø, todël skir-tingø kalbos daliø net ir bendraðakniaikolokatai diktuoja skirtingas linksnio for-mas, plg. apatija apima � apimtas apatijos;apatija jauèiasi � jauèia apatijà � apatija yrajauèiama � nepasiduoti visur jauèiamai apa-tijai. Kitaip sakant, tarp apatijos linksnioformos ir jos kolokatø semantikos tvirtoryðio nëra, nes lemia gramatika. Antravertus, iðryðkëja ir akivaizdi leksinë beisemantinë atskirø linksniø kolokatø raið-ka, todël naudinga yra iðlaikyti su ti-riamøjø leksemø formomis susijusià kon-kordanso struktûrà. Toks yra svarbiau-sias darbo su lietuviø kalbos tekstynomedþiaga ypatumas.

Kiti apatijos kolokataiBe bûtinøjø predikatiniø junglumo part-neriø, apatija dar turi ir papildomø, ku-riuos taip pat verta aptarti siejant su at-skiromis linksniø formomis, taip bandantatrasti jø vartosenos koreliacijas, jei to-kiø bûtø. Tai pirmiausia paþymimaisiaisþodþiais einantys bûdvardþiai, dalyviai,savybiniai ávardþiai ir daiktavardþiai. Jiebuvo trumpai paminëti aptariant patá daþ-niausià vardininko linksná. Ðiuo links-niu vartojamos apatijos daþniausiu paþy-

Page 26: Marcinkeviciene R. Tekstynu Lingvistika

3 2 KALBOTYRA INFORMACINEI VISUOMENEI

miniu eina visiðka, kolokuojanti su apëmë,taigi jau galima áþvelgti trinaræ koloka-cijà apëmë visiðka apatija. Po kelis kartusyra vartojama visuotinë, pilietinë, po kar-tà � visuomenës, pilieèiø, þmoniø; jaunat-viðka, didelë, tam tikra, socialinë, politinë;persisotinusio, slegianti, didëjanti. Savybi-niai ávardþiai ðioje ir kitø linksniø pozi-cijoje yra reti ir ávairûs. Ið viso þodþiaiapatijos prepozicijoje buvo pavartoti pa-lyginti nedaug � tik 25 kartus ið bendro110 konkordanso eiluèiø skaièiaus.Kilmininku vartojamà apatijà paþymi

dalis tø paèiø (þmoniø, visuomenës, pilieti-nës) ir kai kurie kiti daiktavardþiai, bûd-vardþiai, dalyviai: tautos, kaimo, vidaus;atsainios, giliausios, vidinës, smarkiai ásiga-lëjusios letarginës, ðiurpios protà stingdan-èios, nykios, tragiðkos; prislëgtas, apimtas(13 kartø), dominuojanèios, apëmusios. Ne-didelio naudininko konkordanso paþy-miniai negausûs, jie kolokuoja su nepasi-duoti: pilietinei ir politinei, visiðkai, kraðtàapëmusiai, þiemos apatijai. Galininkas prieaukðèiau minëtø paþyminiø þmoniø, pi-lieèiø, visuomenës, politinës, apëmusios darleidþia pridurti nemalonià, siaubingà, bu-kà, dar didesnæ, kûrybinæ, giliausià apatijà.Likæ du reti linksniai nurodo: socialinæ,dvasinæ ir visiðkà apatijà.Ið pateiktø pavyzdþiø galima daryti ið-

vadà, kad paþyminiais einantys þodþiainekoreliuoja su linksniø formomis, at-skirai paëmus linksnius, jie yra pakan-kamai ávairûs, o bendrai imant � pasi-kartojantys. Taèiau pastebëta, paþymi-mieji þodþiai daþnai vartojami prielinks-ninëse konstrukcijose ir beveik visai ne-vartojami, kai apatija eina kaip vienasvardijimo elementas. Jei þiûrëtume jø se-mantikos, galëtume skirti kelias grupes.Vienà jø sudaro platesná apatijos mastàávardijantys þodþiai: visuomenës, pilieèiø,þmoniø, visuotinë, pilietinë, politinë, socia-linë, tautos, kaimo, kraðtà apëmusi, kitai,antonimiðkai, grupei priklausytø keli þo-dþiai: vidaus, vidinë, dvasinë. Treèiàjà grupæsudaro vertinamieji neigiamos konotaci-

jos þodþiais, kuriais nusakomas apatijosdydis � didelë, dar didesnë, didëjanti, domi-nuojanti, bei poveikis � tragiðka, nemaloni,siaubinga, buka, giliausia, letarginë, ðiurpi,slegianti.Bene labiausiai apatijos vardininko kon-

tekste, jei þiûrësime ne predikatiniø jun-glumo partneriø, iðryðkëja labai daþnivardijimo elementai arba koordinaciniuryðiu susieta nesavarankiðkoji þodþiø sà-junga (Balkevièius 1998:43�44), kurios vie-nu elementu ir eina apatija. Ðalia einan-tys kiti vardijimo elementai yra labai daþ-nas ir tipiðkas tiriamojo þodþio konteks-tas � kur kas tipiðkesnis nei paþyminys.Vardijimo tiriamajame kontekste esamadaug ir ávairaus. Pirmiausia, nesavaran-kiðkos þodþiø sàjungos pasireiðkimus ga-lima skirstyti pagal jø nariø skaièiø, o jøgali bûti nuo dviejø iki aðtuoniø. Þe-miau pateikiami bemaþ visi konkordan-se rasti vardijimo atvejai, suskirstyti pa-gal vardijimo elementø kieká.Dvinariai: V. aistros ir apatija; apatija ir nu-sivylimas politine veikla; visiðka apatija ir abe-jingumas; apatija bei iðsisëmimas (ir fizinis, irdvasinis); nyko jo apatija ir rezignacija; didëjaþmoniø apatija ir abejingumas rinkimams; vi-suotinis nusivylimas ir apatija; apatija ir ne-viltis; plintanti apatija bei prisitaikymas; di-dþiausia rezignacija ir apatija; apatija ir nusi-vylimas; apima melancholija, apatija; pradedaimti nuobodulys, apatija; apima apatija, ka-muoja nepaaiðkinamas nuovargis; abejingumasbei apatija; socialinis infantilizmas, socialinëapatija; kam naudinga apatija, tautos nusivy-limas; nusivylimas ir slegianti apatija; nusivy-limas ir apatija;

K. apatijos ir bejëgiðkumo; apatijos ir pesi-mizmo; gelbsti nuo depresijos ir apatijos; iðapatijos ir pilietinio nihilizmo; susvetimëjimo,apatijos ir beprasmybës iðgyvenimø; susveti-mëjimo, apatijos ir beprasmybës iðgyvenimø;apatijos ir nusivylimo marðkà; po lietuviðkoskantrybës ir pilietinës apatijos luobu; N. nepa-siduoti nevilèiai ir apatijai; G. jausti dvasinætuðtumà, apatijà; sukelia piktà dantø grieþimàar apatijà; visuomenës nepasitenkinimà ir apa-tijà; apatijà ir smukimà; Án. apsivylimu ir apa-tija; �klusnumu� ir �dvasine apatija�; virstineveiklumu ir apatija; abejingumu ir apatija;V. apatijoje, depresijoje.

Page 27: Marcinkeviciene R. Tekstynu Lingvistika

3 3Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

Trinariai: V. nedarbas, nusivylimas, apatija;didëja apatija, átarumas, dëmesio ir globos po-reikis; sustiprëjo apatija ir visuomeninis nihi-lizmas, netikëjimas rytdiena; gali apimti depre-sija, apatija, visiðkas neveiklumas; Lietuvojevieðpatauja nusivylimas, apatija, ciniðkas nu-sistatymas prieð politines partijas ir politikus;tautoje vyrauja apatija, nusivylimas ir bevil-tiðkumas; nusiminimas, nepasitikëjimas vienaskitu, apatija; Beviltiðkumas, pasimetimas, so-cialinë apatija; apetitas prapuola, skonis su-genda, apatija apima; K. apimta tø kompleksø,apatijos ir pesimizmo; nemàþtanèios sumaið-ties, apatijos ir pavargimo laikais; abejoniø,abejingumo ir apatijos jûra; didþiausiø negan-dø, juodos nevilties, nykios apatijos laikais;apatijos, abejingumo, nevilties bûsenà; tragið-kos apatijos, depresijos, nusivylimo poþymiai;N. maþiau pasiduodama liûdesiui, beviltiðkumui,apatijai; G. áslysta á pasyvumà, á ðalinimàsi irapatijà; grimzdama á nuobodulá, apatijà, sà-stingá; sàmyðá, apatijà ir nusivylimà; apatijà,depresijà, miego sutrikimus; nepasitikëjimà, ne-apykantà ir politinæ apatijà; nuovargá, apatijàir neþinia ið kur atsiradusá irzlumà; apatijà,nuovargá, nemigà; ðalin apatijà, neveiklumà,�oblomovðèinà!�; Án. pasireiðkia apatija, depre-sija, kartais � agresijos plyksniais; su þmoniøsocialine apatija, dorovine degradacija, politi-niu nestabilumu ir pan.; V. skæsta varge, apati-joje ir alkoholyje.

Keturnariai: V. nykuma ir liûdesys, nuovargisir apatija; iðkart pajuntate, jog suprastëjo savi-jauta, ima stigti energijos, apima apatija, o gy-dytojø patarimai negelbsti; visiðkas skurdas, pri-sitaikymas, pesimizmas ir apatija; ðaltkrëtys,prakaitavimas, prasta savijauta, apatija; apa-tija, silpnumas, virðkinamojo trakto, regëjimosutrikimai ir pan.; K. kupini liguistos neuraste-nijos, dvasios anemijos, vidaus apatijos, bajori-jos atodûsiø; ankstyvo nuovargio, apatijos, me-lancholijos, nesulaikomai bëganèiø metø grau-desio; panacëja nuo nuovargio, viðtakumo, apa-tijos, pervargimo; depresijos, sielvarto, ásiûèioar apatijos �apsësta�; depresijos, apatijos,nevilties, alkoholizmo; baimës, apatijos, nuo-lankumo ir prisitaikymo; G. Kaip vertinate Lie-tuvos pilieèius apëmusá nusivylimà, apatijà, ne-sidomëjimà valstybëje vykstanèiais procesais, per-spektyva.

Penkianariai: þmoniø izoliacija, susvetimëjimas,tapatumø praradimas, diskriminacija, apatijair t.t; vëliau ligoná ima kankinti didþiulis nuo-vargis, nemiga, apatija, bejëgiðkumas, atsiran-da polinkis á pesimizmà ir depresijà; alkoholiz-mas, nuskalstamumas, korupcija, apatija ir ki-

tos blogybës; pasireiðkia hepatomegalija, ano-reksija, apatija, traukuliai, koma; bendras sil-pnumas, mieguistumas, apatija, galvos skaus-mas, soporas.

Ðeðianariai: bloga nuotaika, savæs nevertinimas,kaltës jausmas, apatija, bendravimo sunkumai,suicidinës (saviþudiðkos) mintys; apatija, ne-noras, nerimas, iliuzijos, nerealizuoti jausmai,hormonø audros.

Septynianariai: V. bûdinga apatija, apetito sto-ka, ðleikðtulys, vëmimas, galvos skausmas, mie-guistumas; G. emociniø reakcijø: entuziazmà,apatijà, pyktá, pritarimà, pasitenkinimà, abe-jingumà, susidomëjimà bei kt.

Aðtuonianariai: V. bûdinga vëmimas, bendrassilpnumas, troðkulys, edemos, apatija, stupo-ras, hipotermija, koma; G. suðvelninti nervinæátampà, nerimà, depresijà, baimæ, apatijà, stre-sà, nuotaikos svyravimus.

Kaip matyti ið pavyzdþiø, daþniausiosyra dvinarës, trinarës ir keturnarës þo-dþiø sàjungos, nors esama ir ilgesniø ið-vardijimø. Vardijimo ilgis yra tiesiog pro-porcingas vartojamø linksniø kiekiui. Dvi-nariai ir trinariai junginiai apima visuslinksnius, keturnariai � tik tris, o visilikusieji � tik vienà arba du linksnius.Vardijimo ilgis susijæs ir su tekstø tipubei stiliumi. Ilgesni nei penkianariai þo-dþiø junginiai bûdingi moksliniam sti-liui, specialiosios, ypaè medicininës, li-teratûros tekstams.Tarp koordinacijos ryðiu susijusiø nepriklau-somo þodþiø sàjungos elementø egzistuojane tiek sintagminiai, kiek paradigminiai san-tykiai. Èia galima rasti antonimø (aistros irapatija; dantø grieþimas ir apatija), bet domi-nuoja sinonimai, ir sisteminiai, ir konteksti-niai (apatija ir smukimas; apatija ir klusnumas;socialinis infantilizmas ir socialinë apatija). Sis-teminiø sinonimø èia itin gausu, ávairiuosetekstuose aptinkami vardijimai yra neiðsen-kantis jø ðaltinis. Apatijos sinonimais galëtøbûti laikomi ðie daiktavardþiai, iðrikiuoti jøvartojimo daþnumo tvarka: nusivylimas, abe-jingumas, neviltis, depresija, nuobodulys, ne-veiklumas, bejëgiðkumas, nepasitenkinimas, pe-simizmas, beviltiðkumas, rezignacija, prisitai-kymas, melancholija, nihilizmas, liûdesys, nuo-vargis, etc. Ilgesniuose vardijimuose tarp ele-mentø susiklosto jau nebe sinoniminiai, betkohiponiminiai santykiai, nes apatija draugesu kitais daiktavardþiais reiðkia ligos simp-

3

Page 28: Marcinkeviciene R. Tekstynu Lingvistika

3 4 KALBOTYRA INFORMACINEI VISUOMENEI

tomus, emocines reakcijas, asmenines ydasar visuotines negandas: nedarbas, nusivyli-mas, apatija skatina girtauti, o tai � visos tau-tos rykðtë; apetitas prapuola, skonis sugenda,apatija apima; bendras silpnumas, mieguistu-mas, apatija, galvos skausmas, soporas.

Jei þiûrëtume, kaip nepriklausomos þo-dþiø sàjungos kontekstas atskleidþia apa-tijos reikðmæ, tai galëtume áþvelgti dve-jopo tipo kontekstus. Panaðiai kaip ir apa-tijos paþyminiai bei jos turëtojai, vardiji-mo elementai nurodo asmeninæ ir visuo-meninæ plotmæ, þmogaus ir þmoniø gru-pës apatijà. Pirmoji savo ruoþtu taip patgali bûti dvejopa: pasireiðkianti tik kaiptam tikra bûsena ar kaip vienas ið ligossimptomø. Taigi apatija, nors ir monose-miðka leksema, nëra vienalytës vartose-nos. Jos vartojimas specialiuosiuose me-dicinos tekstuose, politinëje bei meninë-je publicistikoje lemia ir termininæ, ir lais-vesnæ, abstraktesnæ apatijos reikðmæ.Darbas su konkordansu apima du eta-

pus: jo analizæ ir skaidymà á sudedamà-sias dalis, t.y. eiluèiø grupes pagal tiria-mojo þodþio morfologines formas (apati-jos linksnius), o jø viduje � pagal sintak-sinius modelius (daiktavardiniai þodþiøjunginiai su apatijos kilmininku, prielinks-ninës kontrukcijos su apatija, subjektinë,objektinë ir predikatinë apatijos vartose-na). Analizuojant dar giliau, þiûrima kiek-vieno sintaksinio modelio nariø leksinësraiðkos ir jø semantikos, pagal tai skiria-mos kolokatø grupës.Kitas etapas � sintezë, tiriamojo þo-

dþio vartosenos poþymiø ir ypatybiø api-bendrinimas, labai priklausantis nuo dar-bo su tekstynu tikslø. Vienu atveju tyri-mo tikslas yra atlikti leksemos semanti-nës struktûros analizæ ir jai suteikti þo-dyninio straipsnio pavidalà aiðkinama-jame, specialiajame junglumo ar dvikal-biame vertimo þodyne, kitu atveju galirûpëti paèios tiriamuoju þodþiu reiðkia-mos sàvokos apmatai, iðryðkëjantys iðleksemos vartosenos ypatumø. Ðie kon-kordanso analizës tikslai yra taikomojo

praktinio pobûdþio, taèiau tyrëjai galiturëti ir grynai teoriniø tikslø � patikrin-ti turimà hipotezæ ar suformuluoti nau-jà. Kad ir koks bûtø darbo tikslas, jamreikia didelio reprezentatyvaus teksty-no, kad duomenys bûtø patikimi. Be abejo,begalinis duomenø kiekis gali iðgàsdintiir kelti neviltá, bet, anot Beth Levins irkitø, jei su juo susitvarkai, rezultatai pa-prastai bûna puikûs (Levins et al.1997).

2.3. IÐVADOS

Lietuviø kalbos specifika sàlygoja darbosu tekstynu ypatumus: fleksinë jos pri-gimtis reikalaute reikalauja atsiþvelgti ájos þodþiø, ypaè centriniø, tiriamøjø, for-mas, o laisva þodþiø tvarka sakinyje ne-leidþia susitelkti tik á kelias kontekstiniøpartneriø pozicijas tiriamojo þodþio at-þvilgiu, � bûtina imti domën visus saki-nio narius. Ðios abi savybës smarkiai pa-didina tiriamøjø kalbos vienetø ir jø ko-lokatø gramatinæ ávairovæ bei sintaksinæjø distribucijà, o tai savo ruoþtu uþmas-kuoja ir formø ávairovëje iðtirpdo leksi-nius, semantinius, gramatinius bei prag-matinius þodþiø vartosenos ypatumus,t.y. kolokacijas, koligacijas, semantiniusprioritetus bei pragmatinæ vertæ (þr. Sinc-lair 1996).Grieþtos þodþiø tvarkos analitinëje an-

glø kalboje jie iðryðkëja þymiai greièiau,jiems aptikti uþtenka paprastesniø pro-graminiø priemoniø. Jas pritaikius lie-tuviø kalbai, ne visada gauname trokð-tamà rezultatà. Ðtai þodþio paieðka teks-tyne pagal jo ðakná nepavyks, jei skirtin-goms to þodþio formoms bûdinga ðak-nies balsiø kaita, pvz., likti, lieka; o jokolokatø paieðka pagal pozicijà tiriamo-jo þodþio atþvilgiu ar jø gramatinæ for-mà taip pat nebus sëkminga, nes, kaipmatyti ið apatijos analizës, daþniausi apimt*ðaknies kolokatai gali atsidurti ir visaiðalia apatijos, tiek ið kairës, tiek ir ið

Page 29: Marcinkeviciene R. Tekstynu Lingvistika

3 5Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

deðinës: apatija apima, apimtas apatijos, irkeliø atstumu: apimtas didelës nevilties irvisiðkos apatijos. Be to, jie gali ágyti ganadidelæ gramatiniø formø ávairovæ: apim-ti, apima, apëmë, apimtas, apëmusià, apimta,apëmusi, apëmusià, apëmusiai, apëmusios, ap-imtà, apimtus.Ðios ir kitos lietuviø kalbos ypatybës

labai apsunkina darbà su tekstynu. O joreikia didelio, kad per tokià formø gau-sà ir ávairovæ geriau iðryðkëtø pasikarto-jantys modeliai ir jø vienetai. Darbas sugautu ið didelio tekstyno dideliu kon-kordansu neámanomas be specialiø pro-graminiø priemoniø, o reikalingiausiosið jø, konkordanso eilutes klasifikuojan-èio árankio, kaip tik ir nëra, tad tenkapasitenkinti bendrø, darbui su tekstaisskirtø programø teikiamomis galimybë-mis. Mat konkordanso eilutë � sutrum-pinta ar ne � yra svarbiausias kalbinëskonkordanso analizës vienetas. Ið teks-tyno ar konkordanso gauti ávairiø rûðiødaþniniai þodþiø sàraðai tëra tik pagal-binë priemonë þodþiø vartosenai tirti,nes juose neatsispindi þodþiø ryðiai, ájuos, jei pagrindu imamas didesnis kon-tekstas, gali patekti ir visai su tiriamuo-ju þodþiu nesusijusiø þodþiø. To sten-giamasi iðvengti kuriant kolokacijø tin-klus, kuriuose centrinio þodþio koloka-tai susieti su savais, o pastarieji � susavais kontekstiniais partneriais (Williams1998). Taèiau ir prasminiu bei gramati-niu ryðiu susijæ keliø pakopø kolokataidar neparodo viso konteksto, jo ávairo-vës ir turtingumo, ypaè jei reikia apimtiir tiriamojo þodþio pragamatikà.Tarkim, ið viso tekstyno daþninio þo-

dþiø sàraðo, ypaè jei lyginame kelis chro-nologinius jo variantus, gali paaiðkëtivienu ar kitu metu padaþnëjæ þodþiai,bet paimti pavieniai, izoliuoti nuo kon-teksto jie nedaug kà tepasako. Þodþiøjunginiai jau kur kas informatyvesni,pvz., vienas ið daþniausiø daiktavardþiø

yra darbas, jei imsime patá daþniausià jolinksná � kilmininkà, tai daþniausias jokolokatas 2000 metø duomenimis busdarbo birþa. Jei prisiminsime sovietmetá,tai net ir neturëdami to meto tekstyno,galësime pasakyti, kad daþniausi darbokolokatai buvo darbo þmogus/þmonës, darboliaudis. Bet ir paskiri þodþiø junginiainedaug teatskleis konotacijos, kuri pa-aiðkëja tik ið platesnio konteksto. Ðtaibûdvardis karðtas, kai eina su tautybiøpavadinimais, daþniausiai randama sudviem ið jø: karðtas lietuvis ir karðtas gru-zinas. Ir tik platesnio konteksto analizërodo, kad lietuvio karðtumas tapatina-mas su jo patriotiðkumu, o gruzino � suseksualumu. Panaðiai ir aistra publicis-tikos tekstyne 60 procentø visø vartoji-mo atvejø yra vartojama politiniuosekontekstuose, o daþniausia kolokacijayra verda politinës aistros.Tokiø dalykø negalima pamatyti ið at-

skirais þodþiais suskaidyto konkordan-so. Tad kol kas jokios programinës prie-monës negali pavaduoti tyrëjo intuici-jos, jei tik ji taikoma duomenø, mûsøatveju konkordanso eiluèiø, analizei, one jø atrankai (plaèiau apie intuicijos vaid-mená tekstynø lingvistikoje þr. 3.1.). Tai-gi galima daryti iðvadà: darbui su teks-tynu reikia ávairiø árankiø ir jø generuo-jamø produktø, be jø neapsieisi, bet jieyra tuo geresni, kuo maþiau paþeidþia irpertvarko kalbà. Èia buvo pateikti tikkeli labai paprasti tekstyno analizës bû-dai ir produktai, kurie gali pasirodytinetinkami turinèiam kitokiø poreikiø irtikslø. Todël tekstyno analizës modelákiekvienam reikia susikurti paèiam, o èiajau niekaip neapsieisi be áþvalgumo, in-tuicijos ir genialumo pamatyti papras-tus, bet nedideliame tekstø kiekyje ne-pastebimus dalykus. Ne be reikalo Sinc-lairis tvirtina: kalba atrodo visaip kitaip,kai jos vienoje vietoje yra labai daug (as-meninë korespondencija).

Page 30: Marcinkeviciene R. Tekstynu Lingvistika

3 6 KALBOTYRA INFORMACINEI VISUOMENEI

3. TEKSTYNØ LINGVISTIKOSESMË IR PRASMË

Dël TL naujumo ir svarbos ðiandienineikalbotyrai ir kitiems su ja susijusiemsmokslams ar praktinës veiklos sritimsabejoniø nekyla. Tik kai imama kalbëtiapie jos statusà ir svarstyti, kas gi ji yra�naujas metodas, metodologija ar sava-rankiðkà teorijà, kurianti kalbotyros ða-ka, tik tuomet kyla diskusijos. Taigi kasyra tekstynø lingvistika: naujas tradici-nës lingvistikos metodas ar savarankið-ka lingvistikos teorija, visai nauja para-digma? Kaip teigia Doris Schoenefeld,poþiûriai skiriasi nuo visiðkai atmetamoTL savarankiðkumo iki TL skelbimo vi-sai naujos kalbos filosofija (Schoenefeld1999). Èia ir apþvelgsime ávairius TL sta-tusà átvirtinanèius ar paneigianèius ar-gumentus.

3.1. TEKSTYNØ LINGVISTIKOSSTATUSAS

Pirmosios TL esmæ apibendrinanèios mo-nografijos autoriai á klausimà, ar TL yralingvistikos ðaka, ar tik metodologija, at-sako dvejopai: ir taip, ir ne. Ji nëra tokiapat ðaka kaip sintaksë ar semantika, nesðios ðakos apraðo tam tikrà kalbos as-pektà. TL yra daugiau metodologija neiðaka, nes ji gali bûti panaudojama dau-gelio tradiciniø lingvistikos ðakø tyri-mams, bet neturi tokios autonomijos iraiðkiai apibrëþto kalbos vieneto, kurisbûtø jos iðskirtinës analizës objektas(McEnery et al. 1996:2).Kiti vëlesniø studijø autoriai palaiko

ðià mintá, kad negalima TL vadinti visið-kai nauja ir atskira lingvistikos ðaka. Ling-vistams visada reikëjo ðaltiniø teorijomsapie kalbos prigimtá, sandarà, struktûràir funkcijas kaip pagrindo parodyti rea-lø kalbos vartosenos vaizdà. Ávairiu me-tu tokiais kalbiniø duomenø ðaltiniais

buvo intuicija ar introspekcija, eksperi-mentø ar apklausø bûdu gauta informa-cija ir, þinoma, áprastiniu stebëjimo bû-du gauti kalbos apraðai. TL atveju duo-menys yra tiesiogiai gaunami ið tekstø(Kennedy 1998:7). Taigi tekstynais pa-remta analizë laikytina papildanèia tra-dicinës analizës bûdus ir jokiu bûdu nevieninteliu teisingu metodu. D.Biberis nu-rodo, jog klausimai tyrimui, atliekamamremiantis tekstynais, daþniausiai kyla iðvisai kitokio pobûdþio kalbotyros pakrai-pø: pirmesnës struktûrinës kalbos anali-zës, ávairiø teorijø, intuicijos ir dar dau-gelio kitø (Biber et al. 1998:10).Kalbant apie TL statusà, laikomasi nuo-

statos, kad ��nors tekstynas ir gali bûtinauja moksliniø tyrimø sritis, apimantiir naujà metodologijà, bet tekstynø nau-dojimas pats savaime dar neduoda pa-grindo naujai ar savarankiðkai kalboty-ros ðakai. Tiksliau, tekstynø lingvistikayra ið esmës deskriptyvioji kalbotyra, ku-riai naudojamos naujos technologijos.�(Kennedy 1998:268). Èia reikia pridurti,kad deskriptyvioji kalbotyra, be to, kadteikë pagrindà þodynams ir gramatikoms,visada pati veikë ir buvo veikiama teori-nës lingvistikos. Tad bûtø labai keista,jei technologijø revoliucija, tokios apim-ties, kaip kompiuteriø atsiradimas ir ne-paprastai greita jø paþanga, nebûtø iðesmës paveikusi kalbotyros.Taigi galima teigti, jog tekstyno nau-

dojimas nëra nesuderinamas su bet ku-ria lingvistikos teorija, o TL rûpi tie pa-tys dalykai kaip ir visai kalbotyrai: kal-bos ir atskirø jos vienetø prigimtis, struk-tûra, funkcijos, vartosena, kalbos iðmo-kimas, jos reiðkiniø ávairovë ir raida. Norsir papildydama naujais metodais ávai-rias tradicines kalbotyros ðakas, TL ága-vo didesnæ autonomijà labiau koncen-truodamasi á leksikologijà ir leksinæ gra-matikà, o ne á sintaksæ. TL naudoja ásiga-lëjusias mokslinio tyrimo procedûras, ap-imanèias stebëjimà, analizæ, teorijos kû-

Page 31: Marcinkeviciene R. Tekstynu Lingvistika

3 7Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

rimà bei vëlesná jos tikrinimà ir taip su-teikia kalbos apraðui naujà, jos vienetødistribucija pagrástà poþiûrá (Kennedy1998:271). Kuo gi TL papildo ir paávairi-na kitø ðakø ar kitø mokslø metodus? Áðá klausimà galima atsakyti tik aptikusTL ðaknis, visus jos ypatumus ir skir-tybes.

3.2. TEKSTYNØ LINGVISTIKOSYPATUMAI

TL ðaknys slypi empirizme, Firtho kon-tekstualizmo tradicijoje, kuriai itin svar-bus kalbos ryðys su visa komunikacinesituacija, nekalbiniu kontekstu, lemian-èiu kalbos tikroviðkumo, natûralumo svar-bà, ið èia kyla tiriamosios kalbos auten-tiðkumo reikalavimai, poreikis tirti tikrealiai kieno nors tikromis aplinkybëmispasakytà kalbà (Sinclair 1991:3�6, 36).Iki TL pasirodymo autentiðkos kalbos ana-lizë dominavo sociolingvistø darbuose(Marcinkevièienë 1994), nors ir ne tokiuplaèiu mastu, kaip kad atsiradus teksty-nams. Bûdama indukcinë, á konkreèiustekstus ir juose esanèius vartosenos pa-vyzdþius orientuota mokslo ðaka, TL su-gràþino akademinius tyrinëjimus prietikrosios kalbos, nes remiantis raciona-listine tradicija kalba buvo tiriama apsi-einant be tekstø, tiesiog kuriama idea-lioji kalba einant nuo teorijos prie jà iliust-ruojanèiø pavyzdþiø, kuriant lingvisti-nius modelius bei kalbos teorijas, kuriasvëliau buvo bandoma pritempti prie re-alios kalbos (Beaugrande 1999:241). TLatveju kalbos stebëjimas, jos tyrimas, ne-paremtas iðankstinëmis nuostatomis, ima-mas pagrindu teorijoms kurti, o ne at-virkðèiai.Èia verta prisiminti sosiûriðkàjà kal-

bos ir ðnekos dichotomijà. Nuo Ferdi-nando de Saussure�o bendrosios lingvis-tikos laikø, ðià idëjà palaikius NoamuiChomskiui, buvo manoma, kad ðnekos

neámanoma tirti kaip pernelyg heretoge-niðkos. Giluminë struktûra, baziniai sa-kiniai, loginë forma, mentalinë reprezen-tacija, taigi idealybë, buvo teorinës ling-vistikos objektas, realià kalbà pakeièian-ti idealia. O pati lingvistika, anot Hjelm-slevo (nuoroda ið Beaugrande 1999:244),negali bûti patikrinta, remiantis egzis-tuojanèiais tekstais ir kalbomis. Kalbayra virtualioji arba potencialioji sistema,o tekstas � aktualioji, TL kaip tik jas irsieja. Tø ryðiø be dideliø tekstynø nenu-statysi, todël tradicinë lingvistika negalibûti apkaltinta juos praþiûrëjusi, nes ne-turëjo tam jokiø galimybiø. TL lemta su-sieti ðnekà su kalba, kompetencijà su at-liktimi, kitaip sakant, vartosena (compe-tence su performance).TL novatoriðkumà ir galimybes lemia

naujosios technologijos, leidþianèios tir-ti iki ðiol neaprëptus grandiozinius kal-bos masyvus, atlikti kiekybinæ jø anali-zæ, be kurios nebuvo galima pastebëtidaugelio reguliarumø, nes kalbà tyræ at-skiri þmonës neaprëpë didelës kalbos fak-tø gausos. Kompiuteriai ir kompiuteri-nës technologijos atvërë naujas galimy-bes, parodë daþnumus, reguliarius kal-bos vartosenos modelius. Taigi kompiu-teriai ne vien tik palengvino tyrimà, betir suteikë jam visai naujà kokybæ, atvërënaujas tyrimo perspektyvas (Leech 1992).D.Biberis, tyrinëjantis asociacijø mode-lius (association patterns), atspindinèiuskiekybinius ryðius ir atskleidþianèius,kaip, kokiu mastu kalbos vienetai yranulemti konteksto, parodo, kokia svarbiTL yra ir kokybinë, ne vien kiekybinëanalizë, nes paprastai kiekybiniai duo-menys yra vertinami kokybiniu, t.y. funk-ciniu, aspektu (Biber et al. 1998:4)Á tik atsiradusius tekstynus TL prieð-

auðryje imta þiûrëti kaip á didelius pa-þástamos informacijos kiekius ir tik vë-liau susigriebta, kad drauge su pakitu-siu ið tekstynø gaunamu informacijos kie-kiu pakito ir jos kokybë. Tik tos teorijos,

Page 32: Marcinkeviciene R. Tekstynu Lingvistika

3 8 KALBOTYRA INFORMACINEI VISUOMENEI

kurios nepripaþásta atgalinio tekstynoduomenø teikiamo ryðio, neigia, jog di-desnis kalbos vartosenos apraðø kiekisnegali pakeisti jø kokybës. Todël J.Sinc-lairis siûlo pamirðti senas teorines nuo-statas ir ieðkoti tekstynuose naujø kate-gorijø, þvelgti á juos kiek tik ámanomaatviresnëmis akimis ir be jokiø iðanksti-niø nuostatø, kuriø, deja, neámanoma vi-sai iðvengti. Mat stebëjimas nuo pat pra-dþiø yra nulemtas kokia nors teorija, kadir kokia neaiðki ji bûtø, paremtos inter-pretacijos (Sinclair 1997).Ið tekstynø iðryðkëjusi kokybiðkai nauja

kalbinë informacija lëmë dvejopo teks-tynø naudojimo ir kartu dvilypës TL at-siradimà. Nuo pat jø atsiradimo pradþiostekstynai yra naudojami tik reikiamiemspavyzdþiams rinkti ir jau egzistuojan-èioms kalbos teorijoms iliustruoti arbaðiek tiek pakoreguoti. Tokiai analizei, va-dinamai tekstynais paremtu tyrimu (corpus-based approach), uþtenka ir maþø teksty-nø. Taèiau dabar tekstynus imta naudotikur kas radikaliau, TL kvesionuoja esa-mas teorijas ir kalbos tyrimo metodus iðesmës. Kai hipotezës yra keliamos, teorijoskuriamos ir verifikuojamos ið pat pra-dþiø pasirëmus tekstynø medþiaga, jøduomenø analize, turime reikalà su teks-tynu nulemtu/inspiruotu tyrimu (corpus-dri-ven approach) (Bonelli 1996:69). Tokiamtyrimui reikia itin dideliø tekstynø, iðkuriø iðryðkëtø kalbos vienetø vartoji-mo dësningumai, bet tik tekstynø inspi-ruoti tyrimai atveria naujas TL ir jos tai-kymo kompiuterinei lingvistikai galimy-bes. Labai svarbu turëti tokius teksty-nus, kurie pasakytø apie kalbà kur kasdaugiau nei apie jà buvo iki ðiol þinoma.Tekstynø lingvistika, kurios esmæ ir su-

daro tekstynø inspiruota kalbos analizë,leidþia pradëti tirti kalbà ið pat pradþiø,atsisakius iðankstiniø nuostatø ir baga-þo þiniø, sukauptø per daugelá metø. Galtodël prieð tekstynø duomenis, akivaiz-dþiai prieðtaraujanèius egzistuojanèioms

teorijoms, yra nusiteikæ tradiciniais me-todais dirbantys senosios kartos kalbi-ninkai, ir ne tik jie. Tarp kalbos techno-logø taip pat yra ásivyravusi nuomonë,jog apie kalbà jau viskà þinome, lieka tikmûsø þinias perduoti kompiuteriui. J.Sinc-lairis prognozuoja, kad TL gali apverstiaukðtyn kojom visà tradicinæ lingvistikà(Sinclair 2000a). Galima manyti, kad tiktodël, kad iki ðiol buvo daugiau teksty-nais paremta, o ne tekstynø inspiruota,TL kol kas dar netapo nauja kalbos teori-ja, nors, kaip teigia D.Schoenefeld, yradaugiau nei vien metodologija (Schoe-nefeld 1999:140).

3.3. TEKSTYNØ LINGVISTIKAIR KITOS KALBOS TEORIJOS

TL atsirado kaip prieðprieða metodo at-þvilgiu transformacinei generatyvineigramatikai, kaip statistikos ir introspek-cijos metodø prieðprieða, vëliau atsklei-dusi ir jø derinimo galimybës. T.McEne-ry, pateikdamas plaèià ankstyviosios TLapþvalgà, nurodo, kad ið esmës skyrësine tik empirizmu ir racionalizmu, bet irtuo, kaip abiejø krypèiø atstovai suprantakalbotyros tikslà. Generatyvinës grama-tikos tikslu laikomas þmogaus gebëjimokalbëti, jo kalbinës kompetencijos mo-delio sukûrimas.Tad N. Chomskio manymu, tekstynais

besiremiantys lingvistai bando modeliuotine tai, ko reikia kalbos teorijai, t.y. josatliktá, vartosenà. Anot jo, lingvistikostikslas nëra iðvardyti ir apraðyti vartose-nos reiðkinius, o tirti introspekcijà ir pa-aiðkinti kalbinæ kompetencijà kaip tai-sykliø ir gramatiniø apribojimø visumà.Empirinë bazë kalbos apraðui yra gimta-kalbiø intuicija ir introspekcija paremtisprendimai apie atskirø sakiniø grama-tiðkumà. Taèiau ðios teorijos visai nedo-mino net ir gramatiðkø sakiniø autentið-kumas ir tai, ar jie tokie realiai kalboje

Page 33: Marcinkeviciene R. Tekstynu Lingvistika

3 9Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

vartojami. N.Chomskis klausë: kam ieð-koti duomenø tekstyne, jei juos galimarasti savo galvoje. Anot jo, net jei ir lai-kytume iðvardijimà ir apraðymà kalbo-tyros tikslu, jis bûtø nepasiekiamas, neskalba nëra baigtinë, kaip kad nëra baig-tinis galimø sakiniø kiekis. Todël ribotodydþio tekstynas negali atskleisti patiki-mo visos kalbos vaizdo. Be to, negalimaapsieiti be introspekcijos kaip metodo,nes be jo bus neámanoma kalboje aptiktinegramatiðkø ir daugiaprasmiø struktû-rø (McEnery et al. 1996:10).Þvelgiant ið TL pocizijø, taip pat gali-

ma nurodyti kalbos faktus, niekaip ne-aptinkamus savistabos metodais ar vientiktai kalbos jausmu; tai � kalbos vienetøvartojimo daþnumas. Ir ne tik jis. D.Bi-beris teigia, kad þmonës yra linkæ paste-bëti nepaprastus, iðskirtinius kalbos var-tojimo atvejus ir nematyti áprastiniø, daþ-nø (Biber et al. 1998:3). J. Sinclairis taippat ne viename darbe raðë apie intuity-viai nesuvokiamus daþnai vartojamø þo-dþiø desemantizacijos procesus, neap-èiuopiamus daþniausius vartosenos mo-delius ir nepastebimas daþniausias poli-seminiø þodþiø reikðmes. Todël gimta-kalbio turimas kalbos jausmas laikomasnepakankamu metodu kalbai tirti, o pas-tarøjø metø TL darbuose gausu ðiuo me-todu remiantis raðytø gramatikø ir þo-dynø kritikos (Salkie 2000, Barlow 2000tarp daugelio kitø).Bandydami iðlikti objektyvûs, ðiø dviejø me-todø gretintojai nurodo jø abiejø ydas.T.McEnery raðo: �Jei tekstynø lingvistas daþ-nai gali pasirodyti esàs turimø duomenø ver-gas, tai tekstynais nesiremiantis lingvistasgali bûti laikomas savo vaizduotës ánoriø ne-laisvëje� (McEnery et al. 1996:13). G.Kenedyir kai kurie kiti TL metodus iðbandæ kalbi-ninkai bando suderinti abu metodus, teigda-mi, jog vienas nepaneigia kito, tik papildo.Nors ir N.Chomskio pasekëjai atmeta tiki-mybinius kalbos vartosenos modelius, jie yralabai vertingi, ypaè kompiuterinei lingvisti-kai. O kalbà galima apraðyti ir kaip sistemà,kurià mes vartojame, ir kaip naudojimosi tasistema ypatybes, kitaip sakant, ir kaip gali-

mybæ, ir kaip tikimybæ. Pirmasis poþiûris ati-tiktø generatyvistø, antrasis � tekstynø ling-vistø poreikius (Kennedy 1998:270). T.McE-nery teisingai nurodo, kad ir dabar TL yra irturi bûti introspekcijos ir tekstynø duomenøanalizës sàveika, pagrásta automatiniø ir na-tûraliø metodø sàmaiða (McEnery et al.1996:13).

Apie bûtinybæ derinti kelis metodus, dir-bant su tekstynø duomenimis, ir neapsiribo-ti vien tik statistika kalba ir kai kurie kitiþymûs lingvistai. Svartvikas paþymi, kadtekstynai leidþia jø vartotojams net ir nebû-nant gimtakalbiais gauti duomenø, pakarto-tinai jais pasinaudoti, palyginti skirtingus ty-rimus, tirti kalbà ávairiu laiku ir ávairiais re-gistrais, � o ðito neleidþia padaryti jokie kitimetodai, juo labiau introspekcija. Be to, teks-tynai tinka bet kokioms teorinëms hipote-zëms tikrinti. Taèiau Svartvikas pasisakoprieð tekstyno naudojimà vien remiantis sta-tistiniais programiniais árankiais, be jokiosþmogiðkos intuicijos, laikant já vien tik sta-tistiniø tyrimø objektu (Svartvik 1992:7).

Panaðiai mano ir Ch. J. Fillmore. Remdama-sis savo patirtimi, jis taip apibûdino intuici-jos ir tekstyno duomenø santyká: �Kiekvie-nas tekstynas, kuriuo tik naudojausi, kad irkoks maþas jis bûtø, atskleidë tokiø faktøapie kalbà, kuriø niekaip kitaip nebûèiau su-þinojæs� (Fillmore 1992:35). Antra vertus, jismano, kad joks tekstynas, kad ir koks dide-lis jis bûtø, negali parodyti visko, kas yrakalboje. Galiausiai daro iðvadà, kad jei teks-tynas kada nors iðvirs á tokià ðakà, kuriainebereikës intuicijos ir ja paremtos tekstynoduomenø interpretacijos bei kognityvinës in-terpretatoriaus patirties, jo kaip gimtakalbioanalizatoriaus intervencijos, jei viskas busparemta tik statistika ir automatine analize,TL taps neádomi.

TL neapibrëþia savo teoriniø iðtakø,iðskyrus tà, kad ji priklauso Firtho ling-vistinei mokyklai, taigi europietiðkajamkontekstualizmui, todël lingvistai ban-do rasti toká modelá, kuris apimtø ne tikkalbos vartosenà, bet ir jos teorijà, ir taippapildytø TL priskiriamà teorinës dis-ciplinos stygiø. Vienas toks modelis yrakognityvizmas. Schoenefeld átikinamaiparodo, kaip TL aptarti kalbos reiðkiniaigali bûti áterpti á kognityviná kalbos su-pratimà ir jo paaiðkinti. Pavyzdþiui, jinurodo, kad Ronaldo W.Langackerio

Page 34: Marcinkeviciene R. Tekstynu Lingvistika

4 0 KALBOTYRA INFORMACINEI VISUOMENEI

gramatinis modelis, suvokiamas kaipáprastiniø kalbiniø vienetø struktûra(structured inventory of conventional lin-guistic units) siejasi su Sinclairio kalbosfraziðkumo principu. Be to, jo tvirtini-mas, jog þodynas ir gramatika taip per-eina vienas á kità, kad bet kokia skiria-moji jø linija yra arbitrali, siejasi su Sinc-lairio leksinës gramatikos samprata. Taippat ir leksiniø vienetø desemantizacija,tik pavadinta kitais vardais, aptariamakognityvistø darbuose. Apie jà kalbëda-mi ir vieni, ir kiti prieina prie panaðiøiðvadø, skirtumas tik tas, kad TL atsto-vai remiasi dideliais pavyzdþiø kiekiaisir pradeda nuo apaèios, t.y. nuo duome-nø, bet ir jie jauèia poreiká apibendrinti,o ne vien tik apraðyti analizuojamà reið-kiná. Sememos leksiniø reikðmiø sàsajøanalizë irgi panaði á radialiná þodþio reikð-miø modelá bei Fillmore freimø semanti-kos modelá, o jo inicijuotas freimneto pro-jektas geriausiai jungia kognityvinæ irtekstynø lingvistikà (plg. Schoenefeld1999).TL ir kognityvizmo ryðiai dar akivaizdesni,kai imame lyginti George�o Lakoffo iðsamiaiaptartos kalbinës metaforos (dead metaphor)ir kolokacijos esmæ. Kalbinë metafora, bûda-ma kasdienës kalbos savastis ir mûsø màsty-mo bûdas, niekur kitur taip lengvai neaptin-kama kaip tarp abstrakcijas ávardijanèiø þo-dþiø kolokacijø. Taigi kolokacijos yra patsgeriausias metaforø ðaltinis, o kognityvinëjø analizë� geriausias bûdas sàvokoms tirti(Marcinkevièienë 1994, 1999b, 2000c, Maci-jauskaitë 2000, Vaièenonienë 2000).

Taigi TL ir kognityvizmas yra lingvistinësminties mokyklos, naudingai papildanèiosviena kità, tik TL prasideda nuo duomenøanalizës, bet empiriniams duomenims inter-pretuoti jai vis vien prisireikia intuicijos, ko-gnityvizmas daugiau remiasi intuicija ir tiknedideliu kiekiu autentiðkø duomenø. Abiematvejais iðryðkëja, kad introspekcijos bei in-tuicijos lingvistikoje atsisakyti negalima.

Kitas modelis, su kuriuo sietina ir sie-jama TL, yra valentingumo teorija. TLtiria bet kokiø kalbos vienetø, ne tik þo-dþiø, juo labiau ne vien tik predikatiniøþodþiø, distribucijà, paprastai vadinamà

kontekstu, kuri vëliau nëra apibendrina-ma pagal koká vienà bendrà modelá kaiptrimis valentingumo lygiais: loginiu se-mantiniu, gramatiniu (sintaksiniu, mor-fosintaksiniu) ir leksiniu semantiniu (Ja-kaitienë 1988:61, Sliþienë 1994:16). Sinc-lairio pasiûlytieji þodþio vartosenos ana-lizës lygmenys (þr.3.4.2.) su tam tikro-mis iðlygomis galëtø bûti palyginti suvalentingumo lygmenimis: kolokacijos ati-tiktø leksinio semantinio valentingumoleksinæ, o semantinë pirmenybë � seman-tinæ dalá, koligacijos � gramatiná valen-tingumà. Taèiau ðis modelis nëra toksvisuotinis kaip valentingumo modelis,be to, jame labai aiðkiai iðeities taðkulaikomas leksinis, o ne loginis semanti-nis junglumas. Abiem modeliams ben-dra yra gramatinei tiriamojo þodþio kon-teksto raiðkai skiriamas dëmesys, kitaipsakant, leksikos ir gramatikos vienovë.TL galëtø labai sëkmingai papildyti valen-tingumo teorijà ir atskirø þodþiø analizæ, ma-no manymu, silpniausioje jos grandyje � lek-sinio valentingumo, kitaip sakant, semanti-nës dermës tyrime (Jakaitienë 1988:70�72).Pradëta nuo loginiø semantiniø partneriø kie-kio ir pobûdþio tyrimo, vëliau nesunkiai at-liekamos tegu ir ne itin gausiais pavyzdþiaisparemtos gramatinës analizës valentingumonustatymo metodologija leksiniame seman-tiniame lygmenyje apsiriboja tik bendrosio-mis junglumo tendencijomis: nurodoma, ko-kiø semantiniø klasiø (ar atskiri) þodþiai ga-li bûti tiriamøjø predikatiniø þodþiø partne-riø pozicijose. Taèiau tokiø apibendrintø nuo-rodø nepakanka, nes daþnai jungtis gali tikvienas, o ne kitas tos paèios leksinës seman-tinës grupës narys, plg.: matome plika, bet nenuoga akimi (nors kûnas gali bûti plikas irnuogas), vartojame raminamuosius vaistus, ta-èiau agresyviems psichiniams ligoniams yravelkami tramdomieji, o ne raminamieji marðki-niai). Nors ðie bûdvardþiai ir yra sinonimai,bet nurodytuose junginiuose jie negali pa-keisti vienas kito.

Lietuviø kalbos veiksmaþodþiø junglumo ty-rëja N. Sliþienë nurodo, kad �Leksinis valen-tingumas lemia visà veiksmaþodþio leksinæaplinkà, arba leksinæ distribucijà, o jo valen-tiniai palydovai sudaro tik jos dalá: tai tieþodþiai bei jø formos, kuriø reikalauja veiks-maþodþio reikðmë ir kurie sudaro sakinio

Page 35: Marcinkeviciene R. Tekstynu Lingvistika

4 1Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

branduolá. Apraðant veiksmaþodþiø junglu-mà, leksinis valentingumas tik tiek yra ak-tualus, kiek jis susijæs su veiksmaþodþiø va-lentiniais palydovais.� (Sliþienë 1994:29). Jisiûlo nurodyti tik labai ribotà leksiná paly-dovo realizavimà drauge su konkretesneveiksmaþodþiø reikðme, pvz., plauti, mazgotigalima rankas, indus, drabuþius, grindis irdaugelá kitø dalykø, o skalbti galima tik skal-binius (ten pat).

Kitaip sakant, apraðant veiksmaþodþio reikð-mæ, siûloma apsiriboti nurodant, kokiø se-mantiniø klasiø þodþiai gali bûti veiksmaþo-dþio valentiniais palydovais. Taèiau tokiuatveju bûtø apraðoma tik labai bendra veiks-maþodþio reikðmë, todël èia pat tvirtinama,jog: �Norint nustatyti veiksmaþodþiø indivi-dualià leksinæ reikðmæ, semantinio valentin-gumo analizës nepakanka; tam reikalinga de-tali leksinio valentingumo, visos veiksmaþo-dþio distribucijos analizë� (Sliþienë 1994:46)Bûtent èia ir galëtø praversti TL.

3.4. TEORINËS TEKSTYNØLINGVISTIKOS NUOSTATOS

TL statuso aptarimas rodo dar nepakan-kamà jos atstovø indëlá á kalbotyros aruo-dà, garantuojantá atskiros kalbotyros ða-kos su sava teorija vietà, taèiau vien tikmetodologija TL jau nebepavadinsi,� jospostuluojami dalykai apie kalbos esmæir sandarà toli perþengia metodo ribas.Kokios yra svarbiausios TL teorinës nuo-statos, leidþianèios visai naujai paþvelgtiá kelis tûkstantmeèius tyrinëtà kalbà?Atsiradusios tekstynø analizës pagrin-du, jos sudaro sunkiai skaidomà visu-mà ir tik paprastumo dëlei èia pateikia-mos labiau akcentuojant kai kuriuos ðiosvisumos momentus, bûtent: 1) kalbosfraziðkumo principà, 2) iðplëstiná reikð-mës vienetà, 3) desemantizacijà ir 4) tu-rinio bei formos vienovæ. TL teorinesnuostatas suformulavo ir tyrinëjimaispagrindë TL pradininkas Sinclairis, tadèia daugiausia ir bus remiamasi jo dar-bais ir formuluotëmis (Sinclair 1996a,1999a, 1999b ðalia aukðèiau minëtø kitødarbø).

3.4.1. KALBOS FRAZIÐKUMO PRINCIPAS

Aiðkindamas, kaip tekste ir tekstu yrakuriama reikðmë, Sinclairis nurodo dubûdus; vienas jø vadinamas atskirø þo-dþiø, kitas � gatavø ar pusiau gatavøfraziø pasirinkimo principu. Pirmasisprincipas yra tradicinis gramatikø, ypaètransformacinës generatyvinës gramati-kos atstovø, kalbos generavimo mode-lis. Pagal já sakinys ir tekstas ásivaizduo-jamas kaip tam tikra struktûra, pilna kiau-rymiø, kurios vëliau uþpildomos lekse-mø, tenkinanèiø gramatinius apribojimus.Nors ir manoma, kad kalba generuoja-ma ið karto keliuose lygmenyse, ir kiek-vienu atveju vyksta gana sudëtinga josvienetø atranka, taèiau is esmës ðis mo-delis yra gana paprastas: pirmiausia ge-neruojamos gramatinës struktûros, o vë-liau jos papildomos leksiniais vienetais.Iðimtinais atvejai leksiniais vienetais ei-na vienà bendrà reikðmæ turintys susta-barëjæ þodþiø junginiai � idiomos.Sinclairio manymu, ðis atskirø lekse-

mø gramatinio jungimo á sakiná princi-pas daugelio kalbos vartosenos atvejønepaaiðkina. Kalbos vienetø atrankà irjø bendrà vartosenà tam tikru laipsniulemia mus supanèio pasaulio sàranga.Dalykai, suderinami nekalbinëje tikro-vëje, turi didesnæ galimybæ bûti draugeminimi ir kalboje, taigi tikrove galimapaaiðkinti kai kuriuos kalbos vienetø var-tosenos dësningumus. Taèiau atmetus tokápaaiðkinimà turinèius atvejus, tekste darlieka daug þodþiø, kuriø ëjimas draugeneturi nieko bendra su tikrove. Tiesa,dalá tokios vartosenos atvejø galima pa-aiðkinti stiliaus, registro, þanro ar kitaipsocialiai nulemta atranka. Bet atmetusnet ir tuos atvejus, dar lieka daug nie-kaip kitaip, tik kalbos fraziðkumo prin-cipu paaiðkinamos vartosenos.Fraziðkumo, dar kitaip vadinamo idio-

miðkumu (idiomaticity), principo esmë (èiareikia pasakyti, kad idioma suprantamaplaèiàja reikðme kaip bet koks daþnai

Page 36: Marcinkeviciene R. Tekstynu Lingvistika

4 2 KALBOTYRA INFORMACINEI VISUOMENEI

drauge einantis þodþiø junginys, nebûti-nai sustabarëjæs tiek, kad bûtø semantið-kai nedalomas á savarankiðkos reikðmëskomponentus) yra ta, kad bet kuris kal-bos vartotojas turi savo þinioje didelá kiekágatavø ar pusiau gatavø fraziø � atskirøpasirinkimo atvejø, kuriø pagrindu kon-struoja sakiná ir didesnes uþ já teksto at-karpas. Ðie daugiau ar maþiau apstaba-rëjæ þodþiø junginiai suvokiant ar tyri-nëjant kalbà paprastai iðryðkëja tik ið pa-naðiø vartosenos atvejø daugybës, nes:a) daugelis tokiø fraziø turi labai ávairiàapimtá, nuo dviejø iki septyniø ar ir dau-giau þodþiø, b) labai neryðkias frazës ri-bas, paribyje galima kur kas didesnë lek-semø ávairovë nei centre, c) atskiri fra-zës elementai gali leksiðkai ávairuoti irfrazës viduje, d) frazës þodþiø tvarka galikisti, e) nors ir galima gramatinë frazëselementø raiðkos ávairovë, bet daþniau-siai dominuoja viena kuri jos elementøgramatinë forma, f) daugelio fraziø kon-tekstas yra gana fiksuotas, t.y. visa frazëturi kelis daþnus junglumo partnerius,g) daugeliui fraziø bûdinga tam tikra se-mantinë aplinka, specifinis vienus ar ki-tus dalykus þymintis kontekstas (þr. an-glø kalbos terminà semantic preference).Anot Sinclairio, fraziðkumo principas

dominuoja, o atskirø þodþiø pasirinkimoprincipas tik já papildo. Taèiau, nors jie irneveikia drauge, o tik papildo vienas kità,jø galiojimo ribos tekste nëra aiðkios. Vie-no ar kito principo dominavimà lemiateksto stilius, þanras, registras, tema irnet socialinis jo kontekstas. Kuo oficia-lesnis stilius, tuo labiau sustabarëjusi kalba.Matuojant pagal kità skalæ: kuo labiauapgalvotas, ið anksto rengtas tekstas, tuodaugiau jame bus atskirø þodþiø, o nepusiau gatavø fraziø. Ðiuo atþvilgiu spon-taniðki sakytinës kalbos tekstai turi kurkas daugiau fraziø nei raðytiniai, jei tikjie nepriklauso oficialiajam stiliui.Tekstynø analizë átikinamai parodë, kad

labai didelë dalis � apytiksliai apie 80procentø teksto � kuriama parenkant ne

pavienius ir izoliuotus leksinius kalbosvienetus, bet didesnes ar maþesnes jøgrupes, gatavai turinèias tam tikrà gra-matinæ struktûrà. Tas pasakytina ne tikapie idiomas, ið seno laikomas nedalo-momis, bet ir apie didesnæ leksinæ ir gra-matinæ ávairovæ galinèias turëti, maþiauuþ idiomas sustabarëjusias kolokacijas,sudaranèias labai didelæ kalbos apyvar-tos dalá. Kolokacijos ir yra pati konkre-èiausia kalbos fraziðkumo principo ap-raiðka.

3.4.2. IÐPLËSTINIS REIKÐMËS VIENETAS

Tradicinëje kalbotyroje centriniai kalbosvienetai buvo þodis ir sakinys. Nors tiekdël vieno, tiek dël kito apibrëþimo buvodaug diskutuota ir ið principo nesutarta,kà laikyti þodþiu ar sakiniu vienos arkeliø giminiðkø kalbø atveju (o kà jausakyti apie tipologiðkai ir genealogiðkaiskirtingas kalbas), taèiau ðis neapibrëþ-tumas nekliudë þodþiu ir sakiniu remtiskalbø analizëje tarsi dviem kertiniais stul-pais. TL parodë, kad kur kas realesniskalbos sandaros vienetas yra tarpinis da-rinys tarp þodþio ir sakinio, t.y. leksinisvienetas, daþniau nesutampantis nei su-tampantis su þodþiu (Sinclair 1996ab:114).Taigi kalbos analizëje sintaksei tenka nepats svarbiausias vaidmuo. Naujasis kom-pozicinis vienetas yra reikðmës, funkci-jos ir struktûros kompleksas, nors teks-tas ir galima to vieneto raiðkos ávairovëdaþnai tà vienovæ maskuoja. Tokia pozi-cija prieðtarauja atomistiniam gramati-kø modeliui.Þodþio kaip centrinio reikðmës viene-

to ribomis buvo suabejota iðryðkëjus kal-bos fraziðkumo tendencijoms ir atsira-dus naujam tyrimo objektui � kolokaci-jai, apibrëþiamai kaip áprastinis tam tik-rø leksemø vartojimas drauge (Crystal1991). Semantiniu aspektu kolokacijà ga-lima apibûdinti kaip tokià bendrà þo-dþiø vartosenà, padedanèià sukurti reikð-

Page 37: Marcinkeviciene R. Tekstynu Lingvistika

4 3Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

mæ, kuri nëra paprasta visø þodþio reikð-miø suma. Ið pradþiø á akis krinta fik-suota struktûra ir reguliari vartosena, vë-liau � jø lankstumas ir variantiðkumas, opaskiausiai � kûrybingas jø iðplëtimas iradaptavimas, kuris pasitaiko kur kas daþ-niau nei áprastinë, prototipinë jø forma.Kita iðplëstiniø kalbos vienetø savybë� su-stabarëjimo apraiðkos ne tik kolokacijos vi-duje, bet ir iðorëje. Kai kurie sudëtiniai lek-siniai vienetai turi fiksuotà leksinæ ir grama-tinæ aplinkà, daþnus drauge einanèius leksi-nius vienetus, o be to, dar ir pragmatiná pla-tesnio konteksto bendrumà. (Sinclair 1996b).Todël ðiandien kalbama apie keturis iðplësti-nio reikðmës vieneto realizavimo lygmenis:

leksiná � kolokacijà, apimanèià artimiausiàkontekstà,

gramatiná � koligacijà, t.y. gramatinæ kolo-kacijos raiðkà,

semantiná � bendrà semantiná artimøjø ar irtolimesniø kolokatø laukà,

pragmatiná � semantinæ prozodijà, vertina-muosius konteksto elementus.

Jei bandytume pritaikyti ðiuos lygmenis anks-èiau atliktai apatijos junglumo analizei, galë-tume pasakyti, jog subjektiðkai vartojamaapatija daþniausiai jungiasi su apimti ir kitaisveiksmo pradþios bei kitokios semantikos(slëgimo, vieðpatavimo, didëjimo) veiksma-þodþiais, objektinë jos vartosena ribojasi puo-limo á apatijà, jos sukëlimo ir vieðpatavimoveiksmaþodþiais; abiem atvejais � su apati-jos dydá bei priklausomybæ nusakanèiais bûd-vardþiais. Atributiðkai apatija yra vartojamasu ávairiais tiesioginës ir perkeltinës reikð-mës daiktavardþiais. Vardijimuose ji atsidu-ria ðalia ligos simptomus ar ðiaip nuotaikasbei bûsenas ávardijanèiø þodþiø. Tokia tadbûtø apatijos leksinë ir gramatinë aplinka.Semantinis ir pragmatinis kontekstas leidþiapriskirti apatijà prie neigiamai konotuotødaiktavardþiø, ávardijanèiø individø ar þmo-niø grupës patiriamà bûsenà, kuri gali bûtitraktuojama ir kaip nuotaika, ir kaip ligosapraiðka.

Dviejø pastarøjø � semantinio ir prag-matinio � lygmenø priskyrimas iðplësti-niam reikðmës vienetui � dalykas paly-ginti naujas, be to, reikalaujantis tyrinë-tojo áþvalgos ir nemenkø laiko sànaudø,todël daugiau taikomas atskiriems leksi-niams vienetams tirti ir apraðyti (þr. Tog-

nini Bonelli 2000). Kolokacijà galimaiðgauti automatinëmis priemonëmis, jiakivaizdesnë, formalesnë, labiau apèiuo-piama. Gal todël per pastarajá deðimt-metá kolokacijø tyrimas taip iðpopulia-rëjo, kad kolokacija tapo vos ne daþniau-siai kartojamu þodþiu TL darbuose ir ty-rinëjimø objektu. Galima manyti, kad tokáðio kalbos vieneto patrauklumà lëmë netik tekstynø ir kompiuteriø teikiamos ty-rimo galimybës, ne tik kolokacijø svarbakasdieninëje kalbos vartosenoje, bet irliberalus jø suvokimas, leidþiantis áþvelgtivis naujø, vis kitokiø naujojo kalbos vie-neto bruoþø. Tà liudija ir kolokacijos su-pratimo ir apibrëþimø ávairovë (plaèiauapie tai þr. Marcinkevièienë 1995, 1999b).Pati kolokacija, kaip ir jà pavadinantislingvistikos terminas, tokia neapibrëþta,kad kas kaip nori, tas taip ir brëþia jossupratimo ribas (Èermák 1998, Van derMeer 1998). Èia galima áþvelgti tam tikràtolydþio sudëtingëjanèià jos aiðkinimo ten-dencijà, prasidëjusià nuo paties papras-èiausio Sinclairio apibrëþimo, kuriameakcentuojamas tik þodþiø ëjimas drau-ge, per savaime suprantamus kolokaci-jai keliamus prasmingumo ir gramatið-kumo reikalavimus link bent dviejø no-minatyviniø þodþiø normos, netrivialu-mo, tam tikro formos stabilumo ir kaikuriø kitø.Jei þiûrësime reikðmës dalykø, tai ko-

lokacija ir èia uþima tarpinæ padëtá tarpautonomiðkos þodþio reikðmës ir ben-dros visai frazei reikðmës. Kolokacijà su-darantys þodþiai didþiàja dalimi liekanepriklausomi, bet tarpusavyje susijæ, neskuriant kalbà parenkami kaip atskirasvienetas. Kolokacijas paprastai sudarodaþnai vartojami þodþiai, tik labai nedi-delë jø dalis anglø kalboje gali bûti var-tojama nepriklausomai nuo konteksto. Kitiyra savo reikðmæ ágyja tik kontekste, opaimti atskirai yra pernelyg abstraktûs,semantiðkai neraiðkûs, desemantizavæsi(Sinclair 1998).

Page 38: Marcinkeviciene R. Tekstynu Lingvistika

4 4 KALBOTYRA INFORMACINEI VISUOMENEI

3.4.3. DESEMANTIZACIJA

Desemantizacija9 yra procesas, kurio metuleksema netenka pirminës savo vertës,bet ágyja kità funkcijà ir reikðmæ dides-nës apimties leksiniame vienete. Ðis se-mantinis tankis sumaþëja, kai iðnykstaribos tarp leksinio vieneto ir jo aplinkos,kai kolokacijos ir/ar koligacijos papras-tà reikðmës vienetà verèia iðplëstiniu, t.y.tokiu, kurio viso funkcija skiriasi nuosudedamøjø jo daliø funkcijos (TogniniBonelli 2000).Anot Sinclairio, didþiàjà teksto dalá su-

daro daþni þodþiai, vartojami daþnuosemodeliuos arba neþymiai ávairuojanèiuosetø modeliø variantuose, daugelis daþnøþodþiø neturi nepriklausomos reikðmës,bet yra daugiaþodþiø modeliø kompo-nentai. To tradicinës gramatikos mode-liai neatskleidþia. Ðiandieninëje anglø kal-boje iðryðkëja tendencija daþnai vartoja-miems þodþiams turëti priklausomas ar-ba sietines reikðmes, kurias paprastai bûnasunku aptikti, o aptikus � ávardyti ir pa-aiðkinti. Daþnu atveju esame priverstikalbëti apie vartosenos ypatumus, o nepilnateises reikðmes. Pastaruoju metu la-bai padaþnëjo prasmës vienaskaitos ána-gininko vartosena: ta/ðia/tokia/tam tikraprasme. Ðis linksnis sudaro net 43,6 pro-cento nuo visø linksniø, o jo viduje mi-nëtai konstrukcijai tenka 53 procentai visøvartojimo atvejø. Sunku bûtø vienareikð-miðkai nusakyti ðio vartosenos tipo se-mantikà, bet prasmë èia tikrai yra nete-kusi savo pirminës reikðmës ir yra var-tojama kaip áterpinys, delsþodis ar para-zitinis daugelio ávairiø fraziø ir þodþiøpakaitalas. Ta tendencija gali bûti ávardytakaip progresuojanti desemantizacija.Viename ið ankstyvøjø savo darbø Sinclairisnurodo ádomø ir atskiro tyrimo vertà faktà,neminimà vëlesniuose jo darbuose: daþniau-siø þodþiø daþniausios reikðmës nëra aptin-kamos vadovaujantis introspekcija ar kalbosjausmu. Patikrinus ðià hipotezæ labai nedi-deliu eksperimentu ir tekstyno pavyzdþiø

analize, iðryðkëjo ðtai kas: psicholingvistinioeksperimento metu daiktavardþiui aistra daþ-niausiai priskiriamas asociatas buvo meilë,kai tuo tarpu tekstyne ðis þodis daþniausiaiyra vartojamas visai ne su meile ar geidulin-gumu susijusiuose kontekstuose. Panaðiai irklausimas, kur kas daþniau vartojamas kaipdalyko, daikto, reikalo, o ne paklausimo sinoni-mas10 (Marcinkevièienë 1997a). Ið èia kylaproblema: kodël mûsø intuicija ir vartojimodaþnumas nesutampa? Jei pagrindine þodþiøreikðme laikysime tà, kuri pirma ateina á gal-và daugeliui þmoniø, tai ji tikrai nesutaps sudaþniausia tekstyno reikðme. Sinclairio siû-loma hipotezë � pagrindinë reikðmë yra patidaþniausia ið nepriklausomø ar nesietiniøreikðmiø. Jei ta hipotezë pasitvirtintø, tuo-met paaiðkëtø neatitikimas tarp to, kas þmo-niø laikoma pagrindine þodþio reikðme, irdaþniausios tekstyne aptinkamos reikðmës(Sinclair 1991:100).

Desemantizuotà þodynà J.Sinclairis(1996a:112�116) vadina �tuðèiuoju leksi-konu� (empty lexicon) ir prieðina ji termi-nams, kurie neprisitaiko prie savo leksi-nës aplinkos, jie tokie pat izoliuoti ir au-tonomiðki kaip sakiniai, o jø frazeologi-ja yra nuolatiniame pavojuje virsti moks-linës kalbos kliðëmis. Visai kitoks yrakasdienës kalbos þodynas, nuolat atsi-naujinantis, sudarantis naujus þodþiø jun-ginius ir kûrybiðkai prisitaikantis prienaujø situacijø. Taigi Sinclairis skiria dubet kurios kalbos þodþiø ir þodþiø jungi-niø tipus: terminiðkuosius (nebûtinai vi-sada sutampanèius su terminais tikràjato þodþio reikðme) ir tuðèiuosius. Pir-mieji turi fiksuotas, autonomiðkas ir aið-kiai viena nuo kitos besiskirianèias reikð-mes, antrøjø reikðmës iðryðkëja tik teks-te ið artimesnio ar tolimesnio kontekstoelementø, kuriø reikðmës susilieja á vie-nà visumà. Kitaip sakant, iðeities taðkulaikydamas dvejopà kalbos konstravimomechanizmà, Sinclairis ir þodyne áþvel-gia ðá mechanizmà atitinkanèias tenden-cijas: leksiniø vienetø autonomijà ir de-semantizuotøjø priklausomybæ nuo kon-teksto, ëjimà drauge su kitais vienetais,bendrà reikðmæ ir funkcijà tekste. Reikð-

Page 39: Marcinkeviciene R. Tekstynu Lingvistika

4 5Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

më èia suprantama kaip leksinio vienetofunkcija kontekste.Ádomu, kad, remdamasis paskutiniøjø

tyrimø duomenimis, Sinclairis daro ið-vadà apie tai, jog daþnø þodþiø negali-ma priskirti jokiai þodþiø klasei, t.y. kal-bos daliai. Jie turi tik kai kuriuos vienosar keliø kalbos daliø poþymius, o ðiaipjau iðsiskiria unikaliais vartosenos mo-deliais. Taigi galima manyti, kad dese-mantizuoti þodþiai yra ir degramatikali-zuoti, jie vartojami kur kas netaisyklin-giau nei reèiau vartojamos, bet tipiðkos,autonomiðkà reikðmæ turinèios leksemos.Kadangi suabstraktëjæ ir autonomiðkàreikðmæ yra praradæ daþniausiai kalbojevartojami þodþiai, tai Sinclairis daro ið-vadà, jog pati kalbos ðerdis yra netaisyk-linga ir unikali, neáspraudþiama nei á gra-matikos, nei á semantikos taisykliø rë-mus. Juk ne be reikalo patys daþniausianglø kalbos veiksmaþodþiai priklausonetaisyklingøjø grupei (Sinclair 1999b).

3.4.4. LEKSIKOS IR GRAMATIKOS

VIENOVË

Sinclairis vartoja terminà �leksinë gra-matika�, kalbëdamas apie dvi svarbiau-sias kalbos sudedamàsias dalis, kuriø sà-veikoje yra kuriama reikðmë (Sinclair2000b). Nuo senø laikø jos buvo atskir-tos ir apibrëþiamos kaip: viena jø, gra-matika, tam tikrø dësningumø visuma,o kita, leksika, kaip chaotiðka, labai smar-kiai ávairuojanti, apibendrinimams sun-kiai pasiduodanti kalbos struktûros su-dedamoji dalis. Sinclairis daugeliu savodarbø átikinamai árodo tokios dichoto-mijos nepagrástumà ir keliamà pavojøskaidant kalbà á sudedamàsias dalis pra-rasti visumos vaizdà ir jame matomusmodelius. Ðià dichotomijà labiausiaigriauna kompiuteriø suteikta galimybëanalizuoti didelius tekstø kiekius ir ap-tikti bei iðtirti leksinës raiðkos dësnin-

gumus (lexical patterns), iðryðkëjanèius iðplika akimi neapþvelgiamos labai dide-lës konkreèiø apraiðkø ávairovës.Leksikos ir gramatikos atskyrimas su-

ponuoja reikðmës ir struktûros skirty-bes. Nuo F.de Saussure�o laikø suvokiantkalbà kaip vertikaliøjø � paradigminiøir horizontaliøjø � sintagminiø ryðiø vie-novæ, struktûra buvo labiau siejama susintagminiais, o reikðmë � su paradig-miniais ryðiais. Kadangi abu kalbos ry-ðiø tipus yra sunku suvokti ið karto, pa-prastai tyrinëtojø buvo orientuojamasilabiau á vienà ar á kità, o tai lëmë minë-tàjá struktûros ir reikðmës, arba gramati-kos ir leksikos, atskyrimà, pirmenybæ tei-kiant pirmajam. Pagal ásigalëjusià nuo-monæ kalbos struktûra, sintagminis josmodelis yra pirmapradis darinys kon-struojant sakiná. Pagal jos atveriamas vie-tas vëliau ið paradigminës aðies pagalreikðmæ yra parenkami leksiniai viene-tai, uþpildantys jiems skirtas sintagmi-nës kalbos struktûros ertmes. Taigi reikð-më beveik iðimtinai paliekama paradig-matikai.Tekstynø lingvistikoje yra daroma prie-

laida, kad reikðmë kalboje kuriama abie-jose jos dimensijose � ir paradigminëje,ir sintagminëje, todël negalima reikðmësatskirti nuo struktûros, turinio � nuo for-mos. Ið èia kyla poreikis keisti kalboty-ros terminus taip, kad jie neklaidintø var-totojø ir atpindëtø ðiandieniná kalbos es-mës suvokimà, taigi kalbëti ne apie lek-sikà ir gramatikà, o apie leksinæ grama-tikà, t.y. tokià kalbos tyrimø sritá, kurio-je abiem aspektams bûtø skirtas vieno-das dëmesys.Leksikos ir gramatikos vienovæ rodo ir

kai kuriø kategoriø, tokiø kaip neigimasar modalumas, raiðkoje ryðkesnë jø lek-sikalizacija nei gramatikalizacija. Apskri-tai Sinclairis kvestionuoja nevienos gra-matinës kategorijos esmæ, parodydamasgalimas prieðtaras: gramatiðkai neigia-mà formà, bet semantiðkai teigiamà sa-

Page 40: Marcinkeviciene R. Tekstynu Lingvistika

4 6 KALBOTYRA INFORMACINEI VISUOMENEI

kinio reikðmæ, skaièiaus kategorijà, kuridaþnai þymi visai ne skaièiø, o laiko ka-tegorijà � ne laikà (Sinclairis 2000c). Jisátikinamai parodo, kad, kol mes analizëslabui skirstysime kalbà á leksikà ir gra-matikà, tol negalësime jø sujungti á visu-mà. Ryðkiausias pavyzdys � kalbos da-liø kategorijos. Þmonës nesunkiai pri-skiria atskirus þodþius kalbos daliø kla-sëms, taèiau kompiuteris, negalëdamasto padaryti, parodë, kokios neapibrëþtosir arbitralios yra ðios kategorijos, kaipnepakanka morfologinës informacijos,skirstant þodþius á kalbos dalis, kaip bû-tina jà papildyti sintaksine. Ðá poreikáþymi ir kompiuterinës lingvistikos ter-minø raida: anksèiau vartotà terminà �þy-mëjimas kalbos dalimis� (part-of-speech tag-ging) dabar pakeitë �morfosintaksinis þy-mëjimas� (morphosyntactic tagging).Kitas pavyzdys � leksinës reikðmës ir

formaliosios jos raiðkos sàsajos. Vienameið labiausiai cituojamø darbø Sinclairisteigia, jog kiekviena atskira morfologinëþodþio forma potencialiai yra unikalusleksinis vienetas (Sinclair 1991:8). Jung-dami ávairias morfologines formas á vie-nà antraðtinæ, t.y. lemuodami þodá, suni-veliuojame skirtybes, paþeidþiame turi-nio ir formos sàsajas, nes juk visai neaið-ku, kaip reikðmë pasiskirsto tarp lemos irjos formø. Beje, èia keliamas klausimas,kokià formà turëtø turëti lema, ir siûlo-ma lema laikyti daþniausiai vartojamà þo-dþio formà (ten pat:41). Tradiciðkai yrakitaip, lema laikoma kartais vartosenojeir visai neaptinkama þodþio forma, pvz.,lietuviø kalboje abejas, abejonës sinonimas,arba omenis, atminties sinonimas, tekstyneaptinkami tik viena ið neantraðtiniø savoformø: be (jokio) abejo, turëti omenyje. Lek-siniø vienetø ir sintaksiniø struktûrø pa-sirinkimas koreliuoja, jie tikrai nëra ne-priklausomi vienas nuo kito.Apskritai kompiuteriui gali bûti kur

kas sunkiau suprasti kalbà todël, kad re-miamasi neteisingomis teorijomis, suskai-

danèiomis kalbà á tokias dalis, ið kuriøvëliau neámanoma generuoti visumos.Sinclairio manymu, kompiuteriniam kal-bos suvokimui skirtà darbà reiktø pra-dëti nuo leksinës raiðkos dësningumø,kurie iki ðiol kalbotyros istorijoje buvoignoruoti, ir sujungti juos su tuo, kas jaugerai iðtirta ir þinoma apie gramatiniusdësningumus. Kitaip sakant, reikia nau-jø teorijø, kurios galëtø atsirasti ið teks-tynø inspiruotos lingvistikos hipoteziø.Sinclairis postuluojamà formos ir turi-

nio vienovæ pritaiko plaèiau informaci-jos perdavimo modeliui ir kritikuoja tra-diciná komunikacijos modelá, pasireiðkian-tá per kanalo metaforà, pagal kurià turi-nys tarsi ádedamas á praneðimà, t.y. uþ-koduojamas siuntëjo ir atkoduojamas pri-ëmëjo. Kalba yra ið esmës interaktyvi,priklausoma nuo jos vartotojø, tas patspraneðimas reikð skirtingus dalykus skir-tingiems asmenims, todël prielaida apieobjektyvø ir visiems bendrà þinojimà yramitas. Kalba, forma, pavidalas yra neat-skiriama praneðimo, ji yra perteikiamosinformacijos dalis, taip pat svarbi kaip irjos turinys.Postuluodama iðvardytuosius kalbos

analizës principus, TL atmeta iki ðiol do-minavusias ir dabar dar ásigalëjusias nuo-statas apie tai, kad a) kalba yra pagalpaèià savo prigimtá daugiaprasmë, teks-tai yra pilni dviprasmybiø, b) þodis yrasvarbiausias reikðmës turëtojas, c) visireikðminiai kalbos modeliai gali bûti ið-skaidyti á sintaksinius ir semantinius, d)forma ir turinys gali kisti nepriklauso-mai vienas nuo kito, nors ir yra susijæ, e)sintaksë gali abstrahuodamasi nuo kon-kreèiø kalbos apraiðkø apraðyti jos esmæ(Sinclair 1999a:6)Ðios teorinës nuostatos susiformavo

kaip dideliø tekstynø analizës iðdava,pastebëjus ir iðtyrus tuos dësningumus,kuriø nebuvo ámanoma aptikti iki tol nau-dotais metodais. TL nëra vien kiekybið-kai geresnë lingvistika, ji atskleidþia to-

Page 41: Marcinkeviciene R. Tekstynu Lingvistika

4 7Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

kiø dalykø, kokiø be tekstynø niekas irnebûtø manæs ieðkoti. Kaip tvirtina G.Ken-nedy TL pradmenyse, �Esminis posûkismetodologijoje, susijusioje su tekstynølingvistika, yra atsiradæs ne ið teorijos,bet ið to, kà atskleidë dideli tekstynai�(Kennedy 1998:10). Jiems iðsikristalizuotireikëjo laiko ir daugelio þmoniø pastan-gø � tekstynø, Sinclairio atliktos anali-zës atveju � beveik 300 milijonø þodþiøðiandien turinèio Anglø kalbos banko, vi-sos ðiuo tekstynu parengtos Cobuildo þo-dynø serijos, ávairiø projektø ir mokslodarbø. Panaðûs darbai buvo dirbami irkitur Europoje ar uþ jos ribø, ið jø irsusiformavo nauja mokslo ðaka � teksty-nø lingvistika. Kokias gi konkreèios veik-los sritis ji apima?TL apima tris visiðkai skirtingas veiklos sri-tis: tekstynø sudarymà, ánagiø jø analizei kû-rimà (paprastai paliekamà kompiuterineilingvistikai) ir tekstynais pagrástà deskripty-vinæ lingvistikà, tirianèià kalbos vienetø di-stribucijos ypatumus. Ketvirtoji veiklos sri-tis, iðplaukianti ið treèiosios, � tekstynais pa-grásto kalbos apraðo praktinis taikymas kal-bos mokymo(si), natûraliosios kalbos apdo-rojimo, ðnekos atpaþinimo, maðininio verti-mo ir kitoms panaðioms reikmëms. Ðios sri-tys iðryðkëja ið gana gausiø konferencijø me-dþiagos ir kitø mokslo darbø. Pavyzdþiu ga-lëtø bûti tarptautinio TELRI (Trans-Europe-an Language Resources Infrastructure) pro-jekto, skirto ávairiø kalbø resursø kaupimuiir apdorojimui, keleriø metø seminarø temøpasiskirstymas. Pirmajame seminare (Rettiget al. 1995) dominavo turimø kalbos iðtek-liø� tekstynø ir jø pagrindø parengtø leksi-niø duomenø baziø, elektroniniø þodynø pri-statymas, pvz.: kalbiniai iðtekliai Kinijoje,ðvedø kalbos resursai ir jø pritaikymas, MUL-TEXT-EAST parengti Centrinës ir Rytø Euro-pos kalbø iðtekliai, kompiuterizuotas rusøkalbos fondas, internetinis anotuoto olandøkalbos tekstyno variantas, slovënø kalbos ge-leþinkeliø þodynas. Antroje vietoje buvojiems apdoroti skirtø programiniø instrumen-tø � daþniausiai morfologiniø analizatoriødemonstravimas, buvo pristatytos èekø,vengrø ir bulgarø kalbø morfologinës anota-cijos sistemos. Buvo pristatyti ir kodavimostandartai, maðininio vertimo ir ðnekos at-paþinimo tuometinë situacija, kitaip sakant,bendra su TL susijusiø srièiø bûklë.

Antrajame seminare (Marcinkevièienë et al.1997) jau bûta maþiau resursø, ypaè teksty-nø, pristatymo bei apþvalginiø praneðimø.Ið jø minëtini: apie pramonës ir akademiniøinstitucijø ryðius, interneto vaidmená kuriantkalbos technologijas, SILFIDE ir PAROLEprojektus. Taèiau programiniams árankiamsir tekstynø analizës priemonëms ir skirtasnemenkas dëmesys: pristatytos lenkø morfo-loginës ir èekø sintaksinës analizës priemo-nës, bulgarø kalbos verstiniø tekstø parale-lintuvas, universali statistinë tekstynø anali-zës programa. Ðio seminaro metu pradëtosgvildenti teorinës vertimo, reikðmës, teksti-niø vertimo atitikmenø bei vertimo þodynoproblemos. Treèiasis seminaras buvo labiaufokusuotas ir skirtas iðimtinai vertimo, para-leliø tekstynø, dvikalbiø þodynø rengimoproblemoms, èia buvo aptariami ir prakti-niai vertimo automatizavimo dalykai, ir teo-rinës ið to iðryðkëjanèios nuostatos (Teubertet al. 1998). Èia minëtini tie praneðimai, ku-riuose, remiantis paraleliais keliø veikaløtekstynais, tokiais kaip Platono Valstybë irG.Orwello 1984 metai, buvo tirti formos irreikðmës, atskirø kalbos daliø, pritarimo ne-pritarimo raiðkos skirtybiø, performatyviniøveiksmaþodþiø vartojimo ypatumai.

Dviejuose pastarøjø metø seminaruose, ku-riø darbai dar nepublikuoti, labai aiðkiai bu-vo krypstama nuo tekstynø taikymo priva-lumø vardijimo link teoriniø metodologiniøproblemø analizës, o tekstynais remiamasine vien senoms teorijoms iliustruoti ar kriti-kuoti, bet ir naujoms kurti. Taip pamaþu ási-gali tekstynø inspiruota lingvistika. Remian-tis ðiuo TL raidà atspindinèiu konkreèiu pa-vyzdþiu, galima daryti iðvadà, jog ið grynaipraktinës, su taikomojo pobûdþio veikla (lek-sikografija ir kalbø mokymu) susijusios dis-ciplinos TL virsta savà kalbos teorijà kurian-èia mokslo ðaka.

3.5. SÀSAJOS SU KITOMISMOKSLO ÐAKOMIS

B.T.S.Atkins visus potencialius tekstynøvartotojus suskirstë á tris pagrindines gru-pes: a) tuos, kurie domisi tekstø kalba,b) tuos, kurie domisi tekstø turiniu ir c)tuos, kuriems rûpi patys tekstai, jø rû-ðys, þanrai, struktûra (Atkins 1992). Ðiklasifikacija labai gerai atspindi ir TLsàsajas su kitomis mokslo ðakomis, ku-

Page 42: Marcinkeviciene R. Tekstynu Lingvistika

4 8 KALBOTYRA INFORMACINEI VISUOMENEI

rioms ji tiekia darbo metodus ir/ar teks-tynø analizës rezultatus. Tekstø kalbabesidominti tekstynø vartotojø grupë ap-ima tiksliuosius mokslus ir kalbotyrà, ku-riems tekstynas yra kiekybiniø ir koky-biniø duomenø analizës ðaltinis; tekstøturinys paprastai domina kai kuriø kitøhumanitariniø ir socialiniø mokslø at-stovus, o tekstø kaip didþiausiø kalbosvienetø ypatybës � teksto lingvistus, dis-kurso analitikus, nesvarbu, kokià filolo-ginæ pakraipà � kalbinæ ar literatûrinæjie atstovautø. Pagal ðias tris pagrindi-nes tekstynø vartojimo sritis toliau ir busaptariamos TL sàsajos su kitais moks-lais, siekiant parodyti, kodël tekstyno duo-menys svarbûs visoms þemiau iðvardy-toms ðakoms, kà nauja jie duoda tø mokslømetodologijai.

3.5.1. KALBOTYROS MOKSLAI

Informaciniø technologijø pagimdytos pa-lyginti dar naujos mokslo ðakos � TL pri-taikymo galimybës labai plaèios. Jos ap-ima ir teorines, ir praktines veiklos sritiskalbotyroje ir uþ jos ribø. TL teikiamagalimybë operuoti itin dideliais duome-nø kiekiais bei juos apdorojanèia progra-mine áranga pradëjo klibinti ðiandieninëskalbos teorijos pamatus, leido kitaip pa-þvelgti á kai kurias jau nusistovëjusias sam-pratas, pvz., reikðmës, kalbos daliø klasi-fikacijos (plaèiau apie tai þr. 3.2.). Taèiaubene svarbiausia tekstynø lingvistikos pri-taikymo sritimi ir geriausia jos panaudo-jimo galimybe nuo pat pradþiø buvo irliko leksikografija. Juk ne kas kitas, oleksikografai pirmieji ëmë kaupti dar netnekompiuterinius tekstynus (þr. nekom-piuteriniø tekstynø apþvalgà McEnery etal. 1996:2�4). Leksikografija ðiandien ne-beásivaizduojama be didelio kompiuteri-nio tekstyno, ið kurio gauti duomenys le-mia visus þodyno rengimo etapus nuoþodþiø atrankos iki jø apraðo. D.Biberisnurodo, kad TL leidþia atsakyti á tokius

klausimus, á kuriuos nebuvo ámanoma at-sakyti prieð tai: kiek daþnai vartojami skir-tingi þodþiai, kaip skiriasi skirtingø topaties þodþiø reikðmiø vartojimo daþnu-mas, ar þodþiai turi sistemines asociaci-jas su kitais þodþiais, ar þodþiai turi siste-mines asociacijas su specifiniais regist-rais ar dialektais (Biber et al. 1998:21).Bet didþiausia tekstynø dorybë ir svarba

leksikografijai yra kompiuterio garantuo-jama objektyvi duomenø atranka. Seniaipastebëta ir apraðyta grynai þmogiðkaypatybë greièiau pamatyti neáprastus, oatmesti áprastus, daþnus dalykus. Leksi-kografai ðiuo atveju taip pat ne iðimtis.Ðtai H.C.Mortonas pasakoja apie OxfordEnglish Dictonary rengimà, kuriame da-lyvavo savanoriai citatø iðraðinëtojai. Jiepastebëdavo ir uþfiksuodavo retus var-tosenos atvejus kur kas daþniau nei daþ-nus (Morton 1994:95, cituota ið Biber1998:22). Mûsø paèiø nedidelë patirtisrodo tà patá: tekstyno duomenys daþnaipatvirtina, bet neretai ir atmeta leksi-kografo intuicijà (Marcinkevièienë 1997a).Pirmoji anglø kalbos tekstyno Anglø kalbosbanko pagrindu paremta þodynø serija buvoCOBUILD�o þodynai (Sinclair 1987), vëliauiðëjo kiti anglø kalbos þodynai: Britø Nacio-naliniu tekstynu paremti Longmano leksi-kografø leisti þodynai, Cambridge�o þody-nai (Baugh et al. 1996) ir daugelis kitø. Lie-tuviø kalbos leksikografija iki ðiol rëmësi tra-diciniais metodais ir per ilgà laikà nusisto-vëjusia þodynø rengimo praktika. Iki dabarnëra parengto në vieno aiðkinamojo ar verti-mo þodyno, paremto statistiniais tekstynoduomenimis. Net ir patobulëjus techninëmsleksikografijos galimybëms, ëmus naudotitalpias ir patogias kalbos duomenø bazes,þodynø turinys nuo to nepatobulëjo, nes ne-pakito kalbos faktø rinkimo metodai, � jie irtoliau rëmësi ganëtinai atsitiktine atranka irsubjektyviu leksikografo kalbos jausmu. ÐtaiDLKÞ paskutiniame leidime galima rasti ðim-tus ir tûkstanèius ðiandien visai nevartoja-mø þodþiø, bet nëra daþnø kasdienëje kalbo-je vartojamø apsirengti, apsigyventi. Paaugliøþodyne ðiandien nebevartojami ir daugeliuinet nesuprantami þodþiai sudaro apie du pro-centus visos pateikiamos leksikos (Marcin-kevièienë 1999c:41).

Page 43: Marcinkeviciene R. Tekstynu Lingvistika

4 9Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

Parengus 60 milijonø þodþiø apimties Vy-tauto Didþiojo universiteto Dabartinës lietu-viø kalbos tekstynà, atsirado galimybë ir netbûtinybë panaudoti ðiuos kompiuterinius ðal-tinius leksikografijoje. Ðis tolydþio vis didë-jantis ir ávairëjantis tekstynas yra pakanka-mos apimties net ir palyginti retai vartoja-miems þodþiams ar retesnëms daugiareikð-miø þodþiø reikðmëms tirti. Juo bûtø pravar-tu remtis ne tik atrenkant á þodynus dëtinusþodþius, bet ir apraðant jø reikðmes. Þodþiøvartosenos tyrimai tekstyne labai daþnai pa-rodo ne tekstynais pagrástø þodynø duoda-mus netikslumus, iðkraipymus ir taip patei-kiamà klaidingà kalbos vienetø vartosenosvaizdà, pvz., darbas itin daþnai vartojamas�darbo vietos� reikðme: einu á darbà, rytoj ne-bûsiu darbe, bet ði reikðmë þodyne neatsispin-di. Fillmore siûlo gimtakalbiams patikrintisavàjá kalbos supratimà, palyginti su teksty-nu ir pamatyti, kad jie nenurodo kartais netdaþnø vartosenos modeliø. Èia gali labai pa-dëti kolokacijø analizë, kadangi daþniausikolokatai paprastai yra susijæ su skirtingo-mis to paties þodþio reikðmëmis, tai pradinëreikðmiø analizë ir prasideda nuo paþintiessu kolokatais (Biber et al. 1998:35�36).

Tekstynai labai pravartûs ne tik ben-driesiems, bet ir specialiesiems þodynamsrengti, o kai kuriø jø rûðiø net neámano-ma parengti be tekstyno. Pirmiausia to-kie yra naujaþodþiø þodynai, sudaromidideliø, ne vienerius metus kauptø teks-tynø pagrindu. Parengus specialius pro-graminius filtrus, ið jø iðrenkami naujaiá vartosenà patekæ þodþiai (Teubert 1998).Kaip parodë lietuviø kalbos naujaþodþiai,rinkti tik ið keleriø metø laikotarpio irtik publicistikos tekstø, joks kitas ðalti-nis, kaip tik tekstynas, ir joks kitas duo-menø atrankos bûdas, kaip tik specialikompiuterinë programa, nebûtø leidæsaptikti tiek daug naujosios leksikos (Mi-kelionienë 1999, 2000). Tad neologijos ty-rimus galima laikyti iðimtinai tekstynøinspiruota (corpus-driven) kalbotyros ða-ka ir specialiàja leksikografijos sritimi.Kol kas dar anksti tvirtinti, bet atrodo,

kad sinonimø bei antonimø þodynai taippat priklauso tam paèiam be tekstynøneámanomam þodynø tipui. Kaip paro-

dë abstrakèiøjø daiktavardþiø konkor-dansø analizë, ðiandieninëje mûsø kal-boje labai daþnas daiktavardþiø vartose-nos tipas yra vienarûðiø þodþiø, susietøkoordinaciniu ryðiu, vardijimas (þr. 2.2.1.).Todël jis ir galëtø tapti automatiðkai ap-tinkamu sinoniminiu, antoniminiu ar hi-poniminiu ryðiu susijusiø þodþiø ðalti-niu. Tekstyno èia reikia ne tik leksemøatrankai, bet ir tolesnei atskirø jø grupiøreikðmiø analizei. Ir èia TL metodai pa-sirodë esà labai vaisingi, nes tik, pvz.,atskirø sinonimø (Simonavièiûtë 2000)ar antonimø (Macijauskaitë 2000) distri-bucijø analizë gali atskleisti vartosenos,o per jà ir reikðmës skirtybes (plaèiauapie patá metodà þr. Biber et al. 1998).Èia, kaip ir daugeliu kitø atvejø, leksi-kografija ribojasi su leksikologija ir se-mantika, besiskirianèiomis tik analizuo-jamø þodþiø kiekiu ir analizës gilumu.Testynø analizë ðioms mokslo ðakomsteikia objektyviø empiriniø duomenø apieintuityviai ar dirbant su tekstynais ap-tiktus semantinius ypatumus ir dësnin-gumus. TL svarba reikðmës leksiniø vie-netø analizei yra tokia didelë, kad ganasparèiai randasi atskira TL ðaka � teksty-nø semantika (plaèiau þr. Teubert 1999).Kita labai svarbi leksikografijos sritis,

negalinti apsieiti be tekstynø, � terminøþodynai. Dabar pusiau automatinëmisprograminëmis priemonëmis ið specia-liøjø tekstynø (Marcinkevièienë 2000b)sëkmingiausiai renkami ne tik patys ter-minai ar jø vartosenos ypatumai, leidþian-tys atsakyti á klausimà, kas daro terminàterminu, arba kada terminas determino-logizuojamas (Þuperka 2000), bet ir ter-minø definicijos; jos taip pat nesunkiaiidentifikuojamos automatinëmis priemo-nëmis (Pearson 1998). Ið paraleliø ar pa-lyginamøjø tekstynø (þr. 1.1.) automa-tiðkai renkami terminø atitikmenys kito-mis kalbomis. Ðiuo atveju dvikalbiai ardaugiakalbiai terminø þodynai sudaronedidelæ visø vertimo þodynø dalá, ku-

4

Page 44: Marcinkeviciene R. Tekstynu Lingvistika

5 0 KALBOTYRA INFORMACINEI VISUOMENEI

riems paralelûs tekstynai taip pat yraconditio sine qua non. Viena ið ðiandiendaþnø TL temø yra tradiciniø, teksty-nais neparemtø vertimo þodynø kritika,vaizdþiai parodanti, kad þodyniniai irtekstyniniai vertimo ekvivalentai skiria-si kaip diena nuo nakties (Schmied et al.2000, Dickens 1996, 2000, Jaroðova 1997tarp daugelio kitø). Daugelio tyrëjø dar-bai patvirtina tà paèià iðvadà, kad betkoks vidutinio dydþio paralelus teksty-nas turi kur kas daugiau ir patikimesnësinformacijos apie vertimo ekvivalentusnei bet kuris dvikalbis þodynas (Teubert1996, Sinclair 1996, Bonelli 1996, Mar-cinkevièienë 1998).Baigiant vardyti TL ir leksikografijos,

leksikologijos bei leksinës semantikos sà-lyèio taðkus, verta priminti svarbiausiàdalykà: kad ir kokie bûtø rengiami þo-dynai, besiremiantys tekstynais, darboesmë ir principai lieka tie patys � þody-nai turi bûti pradedami rengti nuo teks-tyno (pasirenkant egzistuojantá ar suku-riant naujà), tekstynu reikia remtis ir at-renkant reikiamø þodþiø sàraðus, ir poto analizant tø þodþiø vartosenà. Varto-senos analizë turëtø apimti iðtisus kon-kordansus, tiriamus nuodugniai, o ne pa-sitelkiamus tik atskiriems pavyzdþiamsrinkti. Bûtø idealu, jei leksikografai prak-tikai ar lingvistai tyrëjai galëtø pasitelk-ti automatines ar pusiau automatines dar-bo priemones visam darbo ciklui nuo teks-tyno sudarymo, jo konkordavimo, auto-matizuotos konkordansø analizës, atrink-tø duomenø sintezës iki þodyninio straips-nio elektroninës versijos ar kokio kitogalutinio produkto. Tik tokia visiðkai teks-tynais paremta ir automatizuota leksi-kografija gali uþpildyti þiojëjanèià pra-rajà tarp kalbos apraðø � gramatikø irþodynø � bei realios kalbos vartosenos(Johansson 2000:147).Leksikos tyrimas ir apraðymas yra vie-

na novatoriðkiausiø ir produktyviausiøbei daugiausia þadanèiø TL tyrimo sri-

èiø, nes tekstynø atsiradimas davë nau-jø galimybiø leksiniø vienetø vartojimoypatumams tirti. Kitos kalbotyros ðakossu tekstynais turi kiek maþiau sàlyèiotaðkø, bet ir juos èia verta suminëti. Gra-matika yra antroji pagal tekstynø varto-jimà kalbotyros sritis. Gramatiniø þodþiøklasiø junglumas, kiekybiniu bûdu gau-ti sintaksiniai modeliai ir kai kurios ki-tos temos papildo tradiciná gramatiná kal-bos apraðà. Egzistuoja ir kita sàveikoskryptis, mat morfologinës ir sintaksinëskategorijos imamos pagrindu gramatið-kai anotuojant tekstynà. Ði sàveika at-skleidþia tradicinës gramatikos privalu-mus ir trûkumus, kai jos taisykliø reikiaiðmokyti kompiuterá.G. Kennedy tvirtina, kad �esama didelioporeikio sistemingoms, tekstynais parem-toms visø gramatikos srièiø studijoms, nie-kad neþinai, kà gali rasti tekstyne, nes reikiabûti pasiruoðusiems naujiems modeliams irdistribucijø tipams,� ir pateikia sàraðà temø,kurios turëtø bûti tokiø studijø dalimi. Èiaáeina: kalbos dalys ir morfologinës kategori-jos, þodþiø tipai, kolokacijos, þodþiø jungi-niø klasës, sakinio dalys, sakiniø tipai ir juo-se vykstantys procesai, informacijos struktû-ravimo tipai diskurse, teksto riðlumas (Ken-nedy 1998:274). Net ir neturint tokiø plaèiøuþmojø, tekstynas gali bûti naudojamas kaipávairiø gramatiniø teorijø bandymo vieta.Tuo lengviau juo naudotis, kuo aiðkiau for-maliai iðreikðta tiriamoji kategorija. Tarp to-kiø yra linksnio kategorija, ávairiø afiksø da-riniai bei grieþtà struktûrà turinèios sintak-sinës konstrukcijos (Savickienë 2000, Kalë-daitë 2000).

Leksika ir gramatika kartu paimtos yrapagrindas kontrastyvinei lingvistikai irvertimo teorijai, paremtai keliø tipø teks-tynais: vienakalbiais lyginamøjø kalbøoriginaliø tekstø (ðie tekstynai gali bûtipalyginamieji, jei yra panaðaus dydþio,sandaros ir reprezentatyvumo) ir para-leliais originalo ir vertimo tekstø. Pir-mieji tekstynais paremti ðios srities dar-bai daþniau aptarinëjo metodologijos da-lykus, paèius paralelius tekstynus bei jøparalelinimo programas, o vëlesniuose

Page 45: Marcinkeviciene R. Tekstynu Lingvistika

5 1Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

straipsniø rinkiniuose jau dominuoja tik-rieji tekstynais paremti tyrimai: vertimoatitikmenø paieðkos ir klasifikacija, ak-tualiosios sakinio skaidos bei sintaksi-niø konstrukcijø lyginimas, teksto infor-macinës struktûros tyrimai ir pan. (plg.Johansson 1998). Paprastai daugelis kon-kreèiø studijø tenkinasi vieno ar keliøleksiniø vienetø ar sintaksiniø struktûrøtyrimu ir abiejø vertimo krypèiø (ið uþ-sienio kalbos á gimtàjà ir atvirkðèiai) ly-ginimu tekstynuose, todël turi jau nusi-stovëjusià ðiø, taip pat ir vienakalbiø teks-tynø naudojimo metodikà (plaèiau þr.Johansson 2000).Tekstynø taikymu lyginamosios keliø

kalbø ir vertimo studijoms nedaug kànusileidþia teksto ir diskurso analizë.TL, anot R. de Beaugrande, padëjo atgai-vinti ryðá tarp tikros kalbos ir tikrø teks-tø; esminis jos indëlis á kalbotyrà yra tas,kad kalba vël suvokiama kaip realus, kie-no nors uþraðytas ar pasakytas tekstas(Beaugrande 1999). Dideli tekstynai dau-giausia sudaryti ið netrumpintø, iðtisøtekstø, o ne riboto dydþio imèiø. Tai lei-dþia tirti tekstà kaip visumà bandant uþ-èiuopti jo struktûrà ir ypatumus. Didþiau-sio atgarsio susilaukë Biberio raðytiniøtekstø tipø ir þanrø tyrimai, pagrásti kal-bos ypatumø faktorine analize (Biber 1987,Sigley 1997, Kennedy 1998:193), sakyti-nës ir raðytinës kalbos skirtybëmis (Bi-ber 1988). Tarpinio ðiø dviejø kalbos at-mainø varianto � internetiniø pokalbiøsvetainiø kalbos tyrimo � esama ir Lie-tuvoje (Ryklienë 2000). Dar tiriamos dis-kurso, ypaè pokalbio, struktûros, kieky-biniais metodais nustatomas raðytiniøir sakytiniø tekstø riðlumas. Èia priklausoir vaikø kalbos tyrinëjimai, atliekami re-miantis specialiais vieno ar keliø vaikøkalbos tekstynëliais (Savickienë 1999).Kennedy tvirtina, kad suplonëjusios sie-nos tarp leksikos ir gramatikos, koloka-cijø analizë parodë, kad reikia naujai api-

brëþti þodá ir sudëtines sakinio dalis. Iðèia kyla naujos temos vaikø kalbos ana-lizei: kokiais vienetais jie iðmoksta gim-tàjà kalbà ir kaip jos reiktø mokyti suau-gusius svetimkalbius (Kennedy 1998:271).Prie teksto analizës ðliejasi ir socio-

lingvistiniai tekstynø tyrimai. Bûtina pa-sakyti, kad sociolingvistika ir etnometo-dologija net chomskinëje eroje buvo tasritis, kuri ið esmës rëmësi empiriniaisduomenimis, net jei jie ir nebuvo labaigausûs, todël nepakankami didesniemsapibendrinimams. Sociolingvistus teks-tynuose iki ðiol daugiausia domino sukalbëtojø lytimi bei amþiumi susijæ jøkalbos ypatumai, kuriuos tyrinëti leng-viau, jei tekstynuose uþkoduota ði socio-lingvistinë informacija.Kita iðtisø tekstø reikalaujanti sritis yra

stilistika ir literatûrinë teksto analizë, ku-rioje dominuoja statistiniais metodais at-liekama autorinio stiliaus ir paties kûrinioanalizë. Pagal ávairius vieno teksto rodik-lius � þodingumo koeficientà, prasminiusþodþius, skirstomus á leksines semantinesgrupes, atskirø þodþiø vartojimo daþniosutankëjimus � gali bûti atskleista kûriniosandara: siuþeto vingiai, naujø siuþetiniølinijø pradþios, pagrindinës kûrinio temos(Utka 1998). Autoriaus stiliaus analizei pri-klausytø ir tekstø autorystës bei su juosusijusio plagiato nustatymas. Gana po-puliarios statistinës neþinomø autoriø tekstøstudijos, paremtos stilometrijos metodais,kuriais apskaièiuojami smarkiai besiski-riantys skirtingø autoriø teksto ypatumai:þodþiø, skiemenø ir sakiniø ilgis, kalbosdaliø ir tarnybiniø þodeliø pasiskirtymastekste, visø ir skirtingø teksto þodþiø san-tykis, þodyno ypatumai ir atskirø þodþiødaþnumas, sakiniø struktûra ir pan. Sta-tistiniai metodai leidþia nustatyti ne tiktekstø autorystæ, bet ir to paties autoriaustekstø chronologijà; jie ypaè daþnai taiko-mi biblinëse studijose ir klasikinëje filolo-gijoje.

Page 46: Marcinkeviciene R. Tekstynu Lingvistika

5 2 KALBOTYRA INFORMACINEI VISUOMENEI

Iðtisø senøjø raðtø tekstø kalbos anali-ze remiasi istorinë kalbotyra � dar vie-na kalbinës analizës sritis, kuriai niekaipnegali pagelbëti intuicija.Taèiau istorinëkalbotyra maþai tepaklûsta TL metodo-loginei paradigmai, nes senøjø raðtø teks-tynai yra palyginti maþi, o jø tyrinëjimoprincipai � grieþtai atrankiniai pagal ty-rëjo interesus. Programinës árangos at-þvilgiu su istoriniais tekstynais dirbamataip, kaip ir su ðiandieninës kalbos teks-tais, tik su viena iðimtimi � jie gali bûtinaudojami kaip pradinis atskaitos tað-kas kalbos raidos tyrimams. Taikant teks-tynus kalbos istorijai tirti, gresia keli pa-vojai, jei pernelyg sureikðminami teks-tynø duomenys, kuriuos bûtinai turi pa-pildyti tiriamojo istorinio laikotarpio ben-drosios kalbos ir kultûros þinios. Be to,turimi iðlikæ tekstai negali bûti laikomiatspindinèiais viso laikotarpio kalbà, nestëra tik nedidelë jos dalis. Dël tos paèiosprieþasties jie negali bûti laikomi statis-tiðkai patikimais (Rissanen 1989 nuoro-da ið Kennedy 1998:108)Ið maþiau su TL susijusiø kalbotyros

ðakø minëtinos dialektologija, fonetikair akcentologija, kurios ribojasi su ben-draisiais ar specialiaisiais sakytiniais teks-tynais, nors duomenø randanèios ir ra-ðytiniuose (Kazlauskienë 2000). Psicho-lingvistika � ðiaip jau laboratoriniais eks-perimentais paremta disciplina, bet ir èiagalima pritaikyti tekstynus, ypaè joje daþ-niems sakytinës kalbos riktams tirti. TLsu psicholingvistika sieja daþnai tam pa-èiam tyrimui taikomi tø dviejø kalboty-ros ðakø metodai: psicholingvistinis eks-perimentas daþnai eina kartu su teksty-no duomenø analize ir labai gerai vienaskità papildo (Marcinkevièienë 1997a,1997b, Mönnink 1999, Vaièenonis 2000).Jei prie psicholingvistikos priskirsime

svetimos kalbos mokymà, tai TL vaid-muo ðiø mokslø sandûroje bus dar di-desnis. Mat uþsienio kalbos mokymas jau

keli deðimtmeèiai yra viena ið labiau TLveikiamø srièiø. TL paskatino pakore-guoti du svarbiausius anglø kaip uþsie-nio kalbos mokymo sandus: jos turiná irmetodologijà. Pirmuoju atveju tekstynøanalizë leidþia nustatyti neatitikimus tarprealios vartosenos ir kalbos mokymo va-dovëliuose pateiktos kalbos; pagal teks-tynus galima kritikuoti esamus vadovë-lius: ko jie moko, palyginti su tuo, kaipkalba gimtakalbiai, ar nesuaktualinamaretesnë ir neuþgoþiama realiai daþnesnëvartosena (Ljung 1990). Be to, patys teks-tynai, tiek vienkalbiai, tiek ir paralelûs(plaèiau þr. 1.1.), gali papildyti, jei nevisiðkai atstoti vadovëlius tolesniame kal-bos mokymosi etape. Ðiame etape ið teks-tynø galima mokyti ar paèiam mokytisnet ir gimtosios kalbos. Be specialiøjøvienos kurios nors ðakos ar srities teks-tynø neiðsiverèia ir specializuotos uþsie-nio kalbos, pvz.: verslo, teisës, vadybosir pan., mokytojai. Jiems labai praverèiaautentiðka kalba, natûraliomis bendra-vimo sàlygomis atsiradæ tekstai, kuriuo-se daþnai pasitaiko tos srities þinovø var-tojamø kolokacijø.Metodologiniu aspektu tekstynø naudo-

jimas per uþsienio kalbos pratybas yrasvarbus kaip induktyviojo metodo tai-kymas, kai moksleiviai ar studentai pa-tys tyrinëja jiems duotus konkordansus,ieðkodami atsakymø apie tai, kaip var-tojami vieni ar kiti kalbos vienetai. Jøpaèiø ið pavyzdþiø suvoktos gramatinëstaisyklës ir þodþiø reikðmës, kalbos mo-kymo metodologø teigimu, yra kur kasgeriau ásimenamos nei dedukciðkai, t.y.gatavai, jiems pateiktos vadovëliuose sukeliais jas iliustruojanèiais pavyzdþiaisar þodynuose per definicijas. Tvirtina-ma, kad kalbos iðmokimas ið esmës pa-remtas indukcija (Barlow 2000:109). Priemetodologiniø dalykø skirtini ir kalbosmokymui taikomi esminiai tekstynø ling-vistikos postulatai apie kalbos idiomið-

Page 47: Marcinkeviciene R. Tekstynu Lingvistika

5 3Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

kumà, daþnai vartojamø kalbos vienetødesemantizacijà, leksikos ir gramatikosvienovæ, ypaè � apie iðplëstiná reikðmësvienetà. Funcinis poþiûris á kalbà daroTL itin reikðmingà svetimoms kalbomsmokyti (Tognini Bonelli 2000).Nors TL metodai ir leidþia nustatyti

kalbos vienetus bei jø vartosenos mode-lius, didesnës apimties sisteminius kal-bos reiðkinius ir joje vykstanèius proce-sus, bet mokant kalbø tai ne panacëja,nes kai kurie studentai geriau perprantapervirðkintus dalykus ið þodynø ir gra-matikø. Per didelis pasikliovimas anks-èiau gramatikø neanalizuotais tekstais galivirsti nekoordinuotu, nefokusuotu ir todëlnepakankamu mokymu. Tradiciniø me-todø ðalininkai siûlo nepersistengti tai-kant tekstynus kalbos mokymui, nepa-versti prigimtinio TL deskriptyvizmo nau-jos rûðies preskriptyvizmu, nes vartoji-mo daþnumas � ne vienintelis kriterijusátraukti kalbos vienetus á mokymo pro-gramas. Ir retesni kalbos reiðkiniai galibûti svarbûs, ypaè jei jie sukelia moky-mosi problemø. Juokaudami dedukciniøkalbos mokymo metodø ðalininkai lygi-na kalbos mokymà su mokymu vairuotimaðinà. Jei vairavimo mokymas remtøsiatliekamø operacijø daþnumu, tai nie-kas nemokytø vaþiuoti atbuliniu bëgiu,nes statiðkai toks vaþiavimo bûdas su-daro itin nedidelæ vairavimo dalá (Ken-nedy 1998:290).Apibendrinant TL ir kitø kalbotyros

ðakø sàsajas, labai tiktø pacituoti G.Ken-nedy þodþius, jog �net ir epizodiðkas teks-tyno panaudojimas gali geriau demas-kuoti dël preskriptyvizmo atsiradusiusmitus nei iðtisi paskaitø ciklai ar knygosapie kalbos prigimtá ir raidà� (Kennedy1998:275). Taigi tekstynai laukia ávairiøsrièiø lingvistø, siûlydami ávairias gali-mas temas ir tyrinëjimø sritis. PasaulyjeTL tampa labai populiaria skirtingø kal-botyros ðakø jungtimi. Labai reiktø, kadtaip atsitiktø ir Lietuvoje.

3.5.2. KITØ MOKSLØ ÐAKOS

Kiti humanitariniai mokslai � istorija,ypaè kultûros istorija, filosofija, socio-logija, socialinë psichologija ir kiti nau-dojasi tekstynais ir TL metodais tiek tekstøkalbai, tiek ir jø turiniui tirti. Pastarojotyrimo metodai sociologijoje ir kalboty-roje beveik sutampa, nes dëmesys krei-piamas á tuos paèius dalykus � tiriamøþodþiø reikðmes ir jø vartojimo daþnu-mà. Skiriasi tik analizës tikslai: kalbi-ninkus domina patys þodþiai, o sociolo-gus � jais ávardijami dalykai (Beresnevi-èiûtë 1999, Balèytienë 2000). Þodiniø aso-ciacijø ir konotacijø nustatymas ið kon-kordanso, sociopolitinæ padëtá atspindin-tys padaþnëjæ þodþiai ið daþninio þodþiøsàraðo, tiriamojo teksto turiná atsklei-dþiantys prasminiai þodþiai (key-words)leidþia kalbos priemonëmis tyrinëti vi-suomenës gyvenimo reiðkinius, abstrak-èiø sàvokø supratimà, analizuoti spau-dos leidiniø temas (Marcinkevièienë2000c, Vaièenonis 2000)Ypaè gerø rezultatø duoda keliø teks-

tynø lyginimas, kai norima pastebëti jaunebe kalbinius, o kultûrinius skirtumus.Ðtai G.Leech ir R.Falon, lyginami LOB irBrown, t.y. britø ir amerikieèiø tekstynødaþnumø sàraðus, nustatë statistiðkaireikðmingas skirtybes, suklasifikavo jasá platesnes semantines kategorijas, ku-rios parodë, kuo skiriasi amerikietiðkojianglosaksø kultûra nuo europietiðkosios:daþnesniais keliones, karybà, ginklus irkriminalistikà ávardijanèiais þodþiais(Leech 1992 nuoroda ið McEnery et al.1998:112).Þinomas tekstynø lingvistas Michaelis

Stubbsas tiria ryðá tarp mikrolingvisti-niø reiðkiniø ir makrosocialiniø struktû-rø pasikartojanèiø kontekstiniø partne-riø analizës metodu: �Pasikartojantysávardijimai yra labai svarbûs kalbai irideologijai tirti, nes teikia duomenø apietai, kaip kultûra iðryðkëja ið sustabarëju-

Page 48: Marcinkeviciene R. Tekstynu Lingvistika

5 4 KALBOTYRA INFORMACINEI VISUOMENEI

siø leksiniø junginiø bei modeliø� (Stubbs1996:169). Ðiuo atveju tekstai tiriami nedël jø kalbos, turinio ar struktûros, taigine dël jø paèiø, bet dël to, kas yra ana-pus tekstø. Kultûriðkai svarbiø þodþiøkolokatø analizë atskleidþia kultûros sa-vitumus, o kognityvinis aspektas leidþiaásigilinti á sudëtingus kalbos, sàmonës irkultûros ryðius (Barlow 1998). Stubbsopasiûlytu metodu keliuose tekstynuosebuvo tirta korupcijà reiðkianèiø þodþiøgrupë. Ið tirtø þodþiø kolokatø analizëspaaiðkëjo ryðys tarp konotacijø ir mini-mø geografiniø vietoviø: korupcijos ávar-dijimai kitur nei Didþiojoje Britanijojebuvo ryðkiau konotuoti neigiamai nei ra-ðant apie paèià Britanijà (Orphin 2000).Bene svarbiausia skirtingais metodais

pagrástø kalbotyros ðakø jungtis ir sàly-èio taðkas yra bendras jø tikslas � tirtikalbà ne paèios kalbos labui, bet tam,kad geriau paþintume patys save, savoþmogiðkàjà homo sapiens esmæ. Sàveikau-dama su kitais humanitariniais mokslais,TL iðeina uþ �kalbotyros, skirtos kalbo-tyrai�, ribø ir ima tarnauti platesniems,savæs ir visuomenës paþinimo tikslams.Dar plaèiau ir pragmatiðkiau TL taiko-ma natûraliosios kalbos technologijø kû-rimo procese, bei kompiuterinëje ling-vistikoje.Anot G. Kennedy, kompiuterinë ling-

vistika yra tokia tarpdalykiniø tyrimøsritis, kuri siekia iðanalizuoti ir pamëg-dþioti kompiuteriais tuos procesus ir pro-cedûras, kurie vyksta mums suvokiantir kuriant natûraliàjà kalbà (Kennedy1998:269). Kompiuteriniai lingvistai nau-dojo tekstus dviem poþiûriais: ið pra-dþiø kalbos apraðus ëmë kaip pagrindàgauti taisyklëms (knowledge-based rules),kuriomis buvo remiamasi automatiðkaianalizuojant tekstus. Vëliau tekstynai imtinaudoti kaip kalbos vienetø vartojimotikimybiø ðaltiniai ir kaip eksperimenti-në bazë tikrinti modeliams ir sistemoms,automatiðkai analizuojantiems ar sinte-

tinantiems natûralià kalbà, kitaip sakant,statistiniais tikslais. Ðie du poþiûriai smar-kiai konkuravo, skirtingu metu tai vie-nas, tai kitas poþiûris imdavo virðø, kolgaliausiai buvo ásitikinta, kad jie vienasbe kito negali iðsiversti: statistika, papil-dyta taisyklëmis, yra kur kas patikimes-në (Atkins 1992:14, cituota ið Kennedy1998:269).Kompiuterinæ lingvistikà labai pavei-

kë pasirodæ tekstynai, nes nuo pat josatsiradimo 5-ojo deðimtmeèio pradþioje,be informatikos ir intelektikos, jà dar su-darë ir kalbos teorija, pateikiama tik tra-diciniais morfologijos, sintaksës ir leksi-kos lygmenimis. Iki 9-ojo deðimtmeèiovidurio egzistavo trys pagrindinës KLtaikymo sritis: maðininis vertimas, auto-matinis informacijos iðgavimas (informa-tion retrieval) ir þmogaus bei kompiute-rio bendravimas, vadinamas interfeisu.Kitos, menkesnës, sritys � teoriniø ling-vistø pateiktø gramatikos modeliø tikri-nimas, teksto generavimas, kalbos supra-timo ir sintaksiniø taisykliø modeliavi-mas pagal fraziø struktûros modelius,semantinë analizë, paremta predikatø lo-gika, ir didesniø nei sakinys vienetø in-formacinë struktûra. Tuomet þodis teks-tynas dar nebuvo kompiuterinës lingvis-tikos terminø apyvartoje (Kennedy1998:276). Vëliau, per penkerius metus,dideliø tekstynø naudojimas labai iðpo-puliarëjo, nes paaiðkëjo, kad anksèiau pa-siûlytos taisyklës neatitiko realios kal-bos vartosenos, kuri paaiðkëjo ið statisti-niø duomenø. Taip per statistikà TL at-ëjo ir á kompiuterinæ lingvistikà.Praktinëje kompiuterinës lingvistikos

taikymo � natûraliosios kalbos apdoro-jimo (natural language processing, arba NLP)srityje sëkmingiausiai TL buvo taikomaraðybai, stiliui, gramatikai automatiðkaitikrinti. Taisykliø pagrindu sukurtas sis-temas, naudojamas tekstams morfologið-kai ir sintaksiðkai anotuoti, taip pat la-bai pagerino statistika, gaunama ið teks-

Page 49: Marcinkeviciene R. Tekstynu Lingvistika

5 5Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

tynø. Taigi þmogaus elgsenos, ðiuo atve-ju kalbos vartojimo, matematinis mode-lis pagerino intuityviomis kalbinëmis þi-niomis arba kompetencija paremtà mo-delá; kitaip sakant, bendrosios lingvisti-kos ir TL derinimas pasirodë produkty-vus.Antra vertus, lingvistai jau þinojo, ko-

kia sudëtinga yra kalba, jos struktûra irjoje vykstantys procesai, ir kaip ribotos,eksplicitiðkos formaliosios taisyklës ma-þai tegali aprëpti tas struktûras. Dël sun-kiai nuspëjamos vartosenos kompiuteri-nis kalbos modeliavimas ir imitavimas,anot jø, kol kas beveik neámanomi. Sun-kiausi kompiuterizuoti kalbos reiðkiniaipasirodë esà: elipsë, anafora, ávairios klai-dos ir anomalijos, polisemija, dvipras-mybës, metaforos, idiomos, kalbos vie-netø vartojimo tikslingumas ir nekalbi-nës tikrovës þinios. Dar labai toli iki to,kol kompiuteris atpaþins diskurso funk-cijas ir jo riðlumà.Ðiandieninës kompiuterinës lingvistikosmoksliniø tyrimø sritys, susijusios su teksty-nais, yra gausios: automatinis kalbos daliønustatymas, morfologinë ir sintaksinë anali-zë, daugiareikðmio þodþio reikðmës nustaty-mas, dvikalbiø tekstø paralelinimas, anafo-ros iðaiðkinimas ir teksto ar diskurso struk-tûra. Gautø rezultatø praktinio taikymo sfe-ros taip pat gausios ir ávairios: informacijosiðgavimas ir jam priklausanti automatinëteksto turinio analizë, automatinë dokumen-tø analizë, dokumentø abstraktø rengimas,ávairialypiai leksikografijos automatizavimodarbai (Grefenstette 1998), ðnekos atpaþini-mas ir sintezë, maðininis vertimas, kompiu-teriniø gramatikø kûrimas ir tikrinimas. Itinreikalingos ir aktualios yra daugiakalbëmsaplikacijoms skirtos natûraliosios kalbos ap-dorojimo priemonës: morfologinës analizësir þymëjimo, informacijos iðgavimo ið para-leliø tekstynø ir kai kurie kiti árankiai (Gre-fenstette 1997, Dini et al. 1998). Be viso to,anotuoti tekstynai naudojami kompiuteriamsapmokyti (Zernik 1991).

Maðininis vertimas � tai dar viena sri-tis, kuri neapsieina be TL metodø ir re-zultatø. Ðiandien tik labai apibendrintaikalbant vartojamas �maðininis vertimas�,

atëjæs dar ið tø dienø, kai nebuvo kom-piuteriø, tik elektroninës skaièiavimo ma-ðinos, ðiaip jau skiriamos konkreèios ma-ðininio vertimo rûðys, rodanèios þmo-gaus ir kompiuterio darbo dalá vertimoprocese: þmogaus koreguotas maðininisvertimas (human-aided machine translation)ir kompiuterio palengvintas maðininisvertimas (machine-aided translation). Toksskyrimas atsirado suvokus, kad vien tikkompiuteris negali iðversti bet kokio teks-to, kad idealus maðininis vertimas (fullyautomatic high quality translation) yra ne-ámanomas. Maðininis vertimas gali tar-nauti ávairiems tikslams � raðytinei irgyvajai kalbai, ið anksto supaprastintaiar ribotos tematikos, specialios paskir-ties (patentai, santraukos, techninë do-kumentacija) ir specialiais kanalais (kom-piuteriu, telefonu) perduodama kalbai.Jis gali bûti ávairios kokybës: apytikris,juodraðtinis ar geras, skirtas vienakal-biui vartotojui ar poliglotui, vertëjui armokslininkui, biznieriui ar turistui (Krau-wer 1995). Taèiau nebus idealios verti-mo sistemos, galinèios versti visus teks-tus, visomis temomis taip, kaip tai pada-rytø geriausi vertëjai. Be jokio abejo, kom-piuteris niekada nevers groþinës litera-tûros (Hutchins et al. 1992).TL labai reikia antrajam vertimo tipui,

kai verèia þmogus, naudodamasis jo darbàlabai palengvinanèiais árankiais, kuriuossudaro didelës leksiniø duomenø bazës,iðtisi paralelûs tekstai ar anksèiau vers-tø tekstø atkarpos, ávairûs elektroniniaiþodynai, t.y. vadinamieji leksikonai.Maðininiam vertimui, kaip ir kompiu-

terinei lingvistikai, taikomi tie patys dukalbos duomenø gavimo metodai: kal-bos mokëjimu pagrástos taisyklës (rule-based method) ir statistinis tikimybiø me-todas. Pastarasis pradëtas taikyti vëliau,kai kompiuterinës technologijos jau lei-do turëti didelës apimties tæstinius teks-tynus, ið kuriø ir buvo gauta patikimastatistika. Taip atsirado vienas ið dauge-

Page 50: Marcinkeviciene R. Tekstynu Lingvistika

5 6 KALBOTYRA INFORMACINEI VISUOMENEI

lio maðininio vertimo bûdø, tiesiogiai pri-klausantis nuo tekstynø, � statistinis ver-timas.Statistinis maðininis vertimas visiðkai

atmeta senàsias, ið intelektikos atëjusias,taisyklëmis pagrástas paradigmas. Jo es-më � sudëtingi kalbos vienetø ëjimo drau-ge ir ið tekstyno gautø distribuciniø tiki-mybiø skaièiavimai. Èia buvo atsisakytakognityviniø modeliø, paremtø þmogaussupratimo imitacija. Tekstynai priklau-so empirinei ir struktûrinei kalbotyrai, obendroji kalbotyra yra daugiau kognity-vinë, todël statistinis vertimas modeliuojakalbos vartosenà, o ne kalbinæ kompe-tencijà.Kognityviniu modeliu grástos, brangiai

kainavusios, bet neefektyvios maðininiovertimo sistemos aiðkiai parodë, kad ma-ðininis vertimas negali bûti modeliuoja-mas pagal þmogø vertëjà, o tradiciniaivertimo þodynai negali bûti vertimo sis-temø sudedamàja dalimi. Kad bûtø vaiz-dþiau, kompiuteriu atliekamas vertimasgali bûti palygintas su þmogui skirta uþ-duotimi iðversti ið vienos jam neþino-mos kalbos á kità tokià pat neþinomà kalbànaudojantis vertimo þodynu. Galima tikásivaizduoti, kiek nekalbinës tikrovës þi-niø privalëtø turëti toks kompiuteris irkoks turëtø bûti tokiam darbui tinkantisvertimo þodynas (Teubert 1996).Kitas nuo tekstynø priklausantis maði-

ninio vertimo bûdas yra pavyzdþiais pa-remtas vertimas (example-based machinetranslation), kuris remiasi labai dideliaisparaleliais tekstynais. Juose ieðkoma pa-naðiø á tuos, kuriuos reikia versti, tik jauiðverstø sakiniø. Taèiau kad ir koká di-delá tekstynà surinktume, vis vien jamenerasi visko, ko reikia naujai verèiamamtekstui. Todël buvo pasiûlyta kaupti sin-taksiðkai anotuotus paralelius sakinius,ið kuriø vëliau bûtø iðgaunamos tik at-skiros struktûrinës jø dalys. Taigi vël ku-riamas hibridinis modelis, vël gráþtamaprie kalbininkø interpretacijos ir taisyk-

liø, ðiuo atveju � sintaksiniø. Bet remtissakinio dalimis siûloma tik tuo atveju,kai nerandama gatavo vertimo. Ðiaip artaip, paralelûs tekstynai tapo dar vienumaðininio vertimo bûdu, o tai labai sti-muliavo paralelinimo sistemø kûrimà(McEnery et al.1996:136�138).Taigi TL árodë, kad reprezentatyvus

tekstynas yra pagrindinis moksliniø ty-rimø ðaltinis, tinkantis visø tipø lingvis-tinei analizei ir ávairialypiam praktiniamjos pritaikymui, o kurti bet kokias kal-bos technologijas neámanoma be bendroskomandos su tekstynø lingvistais.

3.6. TEKSTYNØ LINGVISTIKAIR INFORMACINË VISUOMENË

Vis didesná rezonansà ágis tekstynai irTL ðiandieninëje, ir bûsimojoje informa-cinëje visuomenëje, nes kalbos technolo-gija yra informaciniø technologijø ðer-dis, o jos bus svarbiausios XXI amþiauspramonei. Be natûraliosios kalbos tech-nologijø didþiuma informacijos liks ne-tvarkoma ir nesuprantama. Globaliai in-formacinei visuomenei reikia daugiakal-biø technologijø, kad kalbø barjerai ne-kliudytø informacijos srautui. Kompiu-terizuotos, informacinëms technologijomspritaikytos kalbos tampa informacinësvisuomenës preke, gal net árankiu galin-gøjø rankose jiems þaidþiant resursø glo-balizavimo, o kartu ir informacijos kon-trolës þaidimus.Kalbos ekspertai mano, kad kalba turi

specialià vietà tarp kitø komunikaciniøsistemø, ji yra grynai þmogiðka ir tik jigarantuoja visavertá þmoniø bendravi-mà. Kitos specialios þenklø sistemos �pieðiniai, grafikai, schemos, lentelës, ga-liausiai visos dirbtinës kalbos � yra ant-rinës, iðvestinës ið natûraliosios kalbos,struktûriðkai priklausomos nuo kalbos,nors ir neturi linijinio, laike ir erdvëjebesitæsianèio pavidalo kaip kalba. Þmo-

Page 51: Marcinkeviciene R. Tekstynu Lingvistika

5 7Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

nëms geriausia informacijà kurti, kauptiir perteikti þmoniø kalbos tekstu, kad irkoks sudëtingas, painus, daugiaplanis irdaugiaprasmis informacijos perdavimobûdas tai bûtø. Mat kalba, tiek sakytinë,tiek raðytinë, evoliucionavo kartu su vi-suomene, todël viskas joje yra reikalin-ga. Ðiandieniniam kompiuteriui supran-tama tik sterili ir ganëtinai primityvi, bedviprasmybiø, neaiðkumø kalba, bet to-kia ji neleis perduoti naujø idëjø, o galnet ir neleis joms atsirasti. Èia tiktø pri-siminti garsiàjà George�o Orwello utopi-jà 1984-ieji ir joje apraðytà kalbos (pa)pra-stinimo bûdà, garantuojantá politiná lo-jalumà, bet visiðkai atimantá galimybæmàstyti. Todël informaciniø technologi-jø kûrëjø tikslas turëtø bûti kuo maþiauapriboti savo kalbà bendraujant su kom-piuteriu. Ið èia plaukia vienas didþiau-siø TL iððûkiø informacinëms technologi-joms � priversti kompiuterá suprasti irapdoroti natûralios þmoniø kalbos tekstà.Kodël maðininio vertimo sistemos ne-

verèia paprasto teksto? Todël, kad natû-rali þmoniø kalba sunkiai perprantama,á jà sunku ásiskverbti. Viskas daroma,kad tik bûtø iðvengta autentiðko kasdie-nës kalbos teksto, prieð verèiant jis pa-prastinamas, naudojamos ribotos (sub-languages) ir valdomos (controlled langua-ges) kalbos, orientuotos á kompiuterá, one á þmogø. Bet ir tai nepadeda. Kom-piuteriai nemoka elgtis su natûralios kal-bos tekstu, su vidine jo struktûra, tik sujá papildanèiomis paþymomis.Taèiau yra pagrindo manyti, kad kom-

piuteris gali aprëpti kalbà, tik reikia de-ramai jà iðtirti. Èia gali padëti TL, tiek-dama patikimus kalbos apraðus � þody-nus ir gramatikas bei naujus analizës me-todus. Anot Sinclairio, maðina gali su-prasti kalbà pakankamai aiðkiai ir lanks-èiai panaudoti ðá savo supratimà dauge-liui tikslø. Bet kokios pastangos ðia link-me yra svarbios, nes atpildas tikrai mil-þiniðkas: tereikia ásivaizduoti galimybæ

bendrauti su kompiuteriu savo gimtàjakalba, ne per meniu ir/ar pagalbos funk-cijas. Þmogaus ir maðinos bendravimastaip, kad bûtø patogu þmogui, o ne kom-piuteriui, jo gimtàja, natûralia, në kiekneapribota kalba (human-oriented informa-tion services) ir laikomas didþiausiu in-formacinës visuomenës privalumu (Sinc-lair 2000a).Klaidinga manyti, kad kalbinës þinios,

reikalingos kalbos technologijoms, jau yra.Visa daugiau nei 2000 metø istorijà tu-rinti kalbotyra skirta þmogui, todël kom-piuteriui bûtinas þinias reikia pradëti rink-ti nuo nulio. Þiniø apie kalbà galima ágytiið kalbiniø resursø � tekstynø, þodynø,leksiniø duomenø baziø; tik taip galimagauti kitokio pobûdþio kalbos apraðø,geriau tinkanèiø maðinoms, o ne þmo-nëms. Tradicinë lingvistika èia nedaugkà gali pasiûlyti, o keliø deðimtmeèiøbandymai susieti jà su kompiuterio gali-mybëmis baigësi nesëkme, nes modeliaibuvo kuriami neávertinus kalbos varto-senos faktø, empiriniø duomenø. Teks-tynø lingvistø manymu, natûraliosios kal-bos apdorojimo modeliai tik tiek tinkaprograminiams árankiams konstruoti, kiekjie atitinka vartosenà (Teubert 1996, Sinc-lair 1997b).Vartosenos tyrimai ðiandien dar nëra

tokie, kokiø reiktø kalbos technologijomskurti, nes ir patys tekstynai, ir TL darlabai jauni. Bet turint omeny informaci-niø technologijø raidos tempus, galimamanyti, kad tekstynai per keletà metøvisiðkai pasikeis. Jie bus sudarinëjamiautomatiðkai, o duomenys vartotojamsbus iðvedami patikimais automatiniaisánagiais. Tekstyno dydis bet kuriuo tiks-lu já tyrinëjant bus didelë vertybë, nesiðryðkins daþnus vartosenos modelius.Dideliø tekstynø tyrimo pasekmës galibûti nenuspëjamos. Jau dabar aiðku, kadreikës naujø dràsiø hipoteziø paaiðkintikalbos struktûrai ir modeliams, iðryðkë-jusiems tik ið tekstynø, taigi tradiciniø

Page 52: Marcinkeviciene R. Tekstynu Lingvistika

5 8 KALBOTYRA INFORMACINEI VISUOMENEI

lingvistø visai nepastebëtiems ir neap-tartiems. Tad ið TL laukiama kalbos in-formaciniø technologijø kûrimui bûtinørevoliuciniø idëjø.Ir TL, ir kompiuterinë lingvistika yra

tarpdalykinë veiklos sritis. Èia susidu-ria dviejø skirtingø mokslø atstovø � kal-bininkø ir informatikø � poþiûris á kal-bà. Jø prieðtaras labai vaizdþiai nusakëSinclairis, pavadindamas informaciniøtechnologijø kûrimà majonezo problema.Norint gauti majonezà, reikia, lëtai su-kant kiauðinio tryná ir po truputá á já la-ðinant aliejø, sumaiðyti ðiuos du sandus.Jei kiauðinis bus per ðaltas, oras per drëg-nas ar aliejus laðinamas per greitai, ðiedu sandai nesusimaiðys, ir viskà reikspradëti ið naujo. Majonezo metafora ávar-dijamos informaciniø technologijø sude-damosios dalys � kalba ir informacija(Sinclair 1999a).Þmoniø kalbos gynëjai, paprastai kal-

bininkai, mano, kad kalba yra kiauðiniotrynys, o informacija � aliejus. Aliejusturi bûti tinkamai ásuktas á tryná, t.y. ið-reikðtas tekstu, kad atsirastø majonezas.Kadangi kompiuteris tëra pagalbinë prie-monë, tai nereikia jam leisti diktuoti sà-lygø, kaip informacija turi bûti apdoro-jama ir laikoma, kokia turi bûti kalba,kad jis suprastø jà.Kitaip mano informatikai: kalba, anot

jø, tëra vienas informacijos tvarkymo bû-das, beje, labai keblus, nelogiðkas ir ne-tvarkingas, o ið kompiuteriniø pozicijøþiûrint, dar ir neefektyvus, todël bandopateikti kalbà papildomai struktûruotà pa-þymomis ar anotacijomis. Jie tai daro ne-pastebëdami ágimtos, vidinës kalbos struk-tûros, todël apgaubia tekstà savu aiðkina-muoju apvalkalu. Taigi jiems informacijayra kiauðinis, o kalba tik ásiterpia á já.Suprantama, kad abu poþiûriai negali

bûti suderinami, kitaip majonezo sandaiatsiskirs � informatikoje kils sumaiðtis.Arba mes priimame skaitmeninës infor-macijos standartus, pagal kuriuos kalbai

tenka tik nesvarbi vieta, ji yra uþkiðta ákamputá, arba mes, kalbininkai, metameiððûká ðiam modeliui ir parodome natû-ralios kalbos vartojimo privalumus, osvarbiausia � kad ji, nors ir ne be trûku-mø, yra patikima priemonë informacijaikurti, saugoti ir perduoti. Bet tam reikiaargumentø, ir ne tik jø, dar labiau reikianaujø metodø, kurie pranoktø tuos me-todus, kurie atmeta kalbos þmogiðkumà,taigi paèià jos esmæ.Gyvename skaitmeninëje eroje, kur bet

kas gali bûti perteikta skaitmeniniu pa-vidalu, idealiu kompiuteriui apdoroti, nesgaunamos paprastos struktûros, be jo-kiø neaiðkumø ar dviprasmybiø ir kitøgalvos skausmø, kuriuos kelia kalba in-formatikams, mëginantiems kompiuteri-zuoti kalbà. Tad kyla pavojus, kad tiepatys þmonës, kurie pateikia puikius in-formacijos perdavimo ir apdorojimo áran-kius, tokius kaip tekstinis redaktorius,hipertekstas ir internetas, gali uþimti mû-sø, lingvistø, vietà ir pakeisti kalbiniusmodelius informaciniais. Tai paveiktø visàkompiuteriuose vartojamà kalbà: verti-mà, informacijos gavimà, dokumentø kla-sifikavimà, leksikografijà ir net kalbosmokymà. Tokio pertvarkymo poveikiskalbai gali bûti nenuspëjamas. Sinclairismato tik dvi alternatyvas: arba mes, rem-damiesi tekstynais, juose iðryðkëjusià vi-dinæ kalbos struktûrà pateiksime þmo-niø kalbos technologams, arba mûsø pa-slaugø bus atsisakyta, tik nuo to niekamnebus geriau.Kalbininkai turëtø siekti sugràþinti pa-

sitikëjimà þmoniø kalba kaip svarbiau-sia komunikacijos priemone ne tik tarpþmoniø, bet ir tarp þmogaus ir kompiu-terio. Sinclairis primena, kad viena iðsvarbiausiø þmogaus teisiø yra teisë áþmoniø kalbà, net ir bendraujant su kom-piuteriu, taigi kompiuterius reikia tai-kyti prie þmogaus, o ne atvirkðèiai. O èiatekstynø lingvistika, derinama su kitømokslø metodais, gali labai praversti.

Page 53: Marcinkeviciene R. Tekstynu Lingvistika

5 9Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

1 Èia ir kitur � mano vertimai. R.M2 Tekstynø apimtys matuojamos já sudaranèiøtekstø þodþiais (running words), dar kitaip va-dinamais þodþiø pavartojimais, o ne skirtin-gais þodþiais. Pastarieji rodo tekstyno turtin-gumà ir leksinæ ávairovæ.

3 Ðiame tekste sintaksinës analizës programaipavadinti vartojamas skolinys parseris, labaipaplitæs anglø, o dabar jau ir kitose Europoskalbose, turintis dariniø, plg.: to parse, parsing.Lietuviø kalboje nëra tokio árankio ar bent joanalogo, ir iki ðiol neprireikë apie já kalbëti,todël savo termino kol kas neturime, o naudo-ti triþodá apraðomajá vertimà, t.y. sintaksinësanalizës programa ar dviþodá sintaksës analizato-rius, neparanku, juolab kad taip pavadintasprograminis árankis gali bûti lengvai supai-niotas su sintaksiniu teksto anotavimu ar þy-mëjimu, nuo kurio jis ið esmës skiriasi.

4 Lietuviðkà terminà �tekstynas� vietoj skolinto�korpusas� pasiûlë VDU Informatikos fakul-teto doc. dr. Eugenijus Teleðius per 1994 1110-11 Rygoje vykusá Europos Komisijos orga-nizuotà seminarà Kalba ir technologija Europo-je 2000. Baltijos ðaliø perspektyvos.

5 Visi kompiuterio ekrane iðvedami kurio norsþodþio ar þodþio formø vartojimo atvejai ðian-dien lietuviø kalboje vadinami dvejopai: kon-kordansais ar konkordancijomis nelygu ið ko-kios kalbos � anglø ar lotynø ðie þodþiai yrapasiskolinti. Ðiame tekste vartojami abu ter-minai. Pirmuoju vadinamas ið visø kitø teks-tø, iðskyrus Ðventàjá Raðtà, gautø tiriamøjøþodþiø ar jø formø kontekstø eilutës, antrasisterminas skirtas tik Ðventajam Raðtui, nes ðistekstas turi labai senas, viduramþius siekian-èias rankraðtinio konkordavimo tradicijas irsu jomis sutapusá lotyniðkàjá terminà.

6 Reikia perspëti skaitytojà, kad terminø para-lelus (parallel) ir palyginamasis (comparable), kaijie vartojami anglø kalba, reikðmës ávairuoja.Plaèiau yra paplitusi paralelaus - originalo irvertimo tekstø tekstyno samprata, taèiau kaikurie autoriai paraleliais vadina, mûsø su-pratimu, palyginamuosius tekstynus, pana-ðiomis proporcijomis sudarytus ið dviejø ardaugiau kalbø originaliosios neverstinës lite-ratûros tekstø, o verstiniams taiko vertimo teks-tynø vardà.

7 Angliðkas terminas key-word Lietuviø-anglø-rusø-vokieèiø kalbø terminø þodyne INFORMA-

TIKA (red. R.Valatkaitë ir Z.Kudirka, V., 1999)yra verèiamas raktaþodis, deskriptorius. Taèiautekstynø lingvistikoje, kalbant apie vienametekste ar tekstyne daþniau nei tikëtina varto-jamus þodþius, labiau tinka prasminio þodþioterminas, nes bûtent ðie þodþiai nurodo teks-to temas, jo turiná, taigi lyg ir jo prasmæ. Mi-nëtame þodyne esama ir kitø kompiuterijosterminø, kuriø vertimas niekaip netinka teks-tynø lingvistikos reikmëms, plg.: alignment -iðlygiavimas, iðlyginimas, lygiuotë, mûsø atve-ju � tekstø paralelinimas ar lygiagretinimas, con-cordance � atitikimas, mûsø atveju � konkor-dansas ar konkordancija, node � mazgas, sankir-ta, mûsø atveju � centrinis, tiriamasis þodis,span � diapazonas, mûsø atveju � tiriamojo þo-dþio konteksto apimtis, intervalas

Ðiame þodyne esama ir kitø netikslumø, pvz.,computer-assisted translation verèiamas kompiu-teriniu vertimu, kai ið sàvokø prieðprieðos hu-man-aided machine translation vs. machine-aid-ed human translation iðryðkëja, kad ðiuo atvejuturimas omenyje þmogaus atliktas vertimasnaudojantis kompiuteriu. Be to, èia negalimarasti net paèiø populiariausiø tekstynø ling-vistikos terminø, jau seniai perëjusiø á kom-piuterinë lingvistikà, tokiø kaip corpus, collo-cation, stop-word, lemmatise ir dar daugeliokitø.

8 Duomenys ðiai lentelei buvo paimti ið VDULietuviø kalbos katedros bakalaurinëms ir ma-gistrinëms studijoms rengtø kursiniø ir diplo-miniø darbø.

9 Terminas desemantizacija èia yra vartojamasvietoj angliðkojo delexicalization, kuris ið es-mës reiðkia tà patá: leksinës reikðmës susilpnë-jimà arba praradimà

10Lietuviø kalboje esama nemaþo bûrio suabst-raktëjusiø daiktavardþiø, tokiø kaip gairë,spraga, penas, atotrûkis, praraja, svyravimas,prizmë, akstinas, uþnugaris, nuotrupa, saitas, ta-koskyra, uþuolanka, ðaltinis, ir kt., kurie labairetai vartojami savo pagrindinëmis tiesiogi-nëmis reikðmëmis. Pateikus juos eksperimen-to dalyviams paaiðkëjo, kad jø nurodytieji aso-ciatai taip pat þymi ne tiesiogines, o perkelti-nes reikðmes, pvz., spraga buvo siejama suklaida, yda, þiniø spraga, bet ne su plyðiu tvo-roje ar kur kitur. Taèiau ne ðie atvejai turimiomenyje, kai kalbama apie skirtingus teksty-no ir gimtakalbiø intuicijos duomenis.

PASTABOS

Page 54: Marcinkeviciene R. Tekstynu Lingvistika

6 0 KALBOTYRA INFORMACINEI VISUOMENEI

Atkins B.T.S., J. Clear and N. Ostler, 1992. �Cor-pus Design Criteria�. Journal of Literary andLinguistic Computing 7(1):1�16.

Balèytienë A. 2000. �Þiniasklaidos tekstai�. Dar-bai ir Dienos 24: 109�119.

Balkevièius J. 1998. Lietuviø kalbos predikatiniøkonstrukcijø sintaksë. Vilnius: Mokslo ir encik-lopedijø leidybos institutas.

Barlow M. 1998. �Review. Michael Stubbs: Textand Corpus Analysis: Computer-assisted Studiesof Language and Culture�. International Journalof Corpus Linguistics 2(3):319�326.

Barlow M. 2000. �Parallel Texts in LanguageTeaching�. Multilingual Corpora in Teachingand Research, ed. by S.P.Botley et al. 106�115.Amsterdam and Atlanta:Rodopi.

Baugh S., A.Harley and S.Jellis. 1996. �The Ro-le of Corpora in Compiling the CambridgeDictionary of English�. International Journalof Corpus Linguistics 1(1):39�60.

Beaugrande de R. 1999. �Reconnecting RealLanguage with Real Texts: Text Linguisticsand Corpus Linguistics�. International Journalof Corpus Linguistics 2(4):243�260.

Beresnevièiûtë V., I. Nausëdienë. 1999.�TrysLietuvos dienraðèiai (�Lietuvos rytas�, �Res-publika�, �Lietuvos aidas�) apie tautines ma-þumas Lietuvoje�. Sociologija 1(3):67�78.

Biber D. 1987. �A textual comparison of Britishand American writing�. American Speech62:99�119.

Biber D. 1988. Variation across Speech and Wri-ting. Cambridge: University Press.

Biber D. 1993. �Representativeness in CorpusDesign�. Literary and Linguistic Computing,8(4):243�257.

Biber D., S.Conrad and R.Reppen.1998. CorpusLinguistics. Investigating Language Structureand Use. Cambridge: University Press.

Crystal D. 1991. A Dictionary of Linguistics andPhonetics. Basil: Blackwell.

Èermák F. 1997.�Czeck National Corpus:A Case in Many Contexts�. International Jour-nal of Corpus Linguistics 2(2):181�198.

Èermák F. 1998.�Linguistic Units and Text En-tities: Theory and Practice�. EURALEX�98 Pro-ceedings, ed. by T.Fontenelle et al., 109�118.Liege: University of Liege.

Danielsson P. and D.Ridings. 2000. �Corpus andterminology: software for the translation pro-gram at Göteborgs Universitet or getting stu-

dents to do the work�. Multilingual Corpora inTeaching and Research, ed. by S.P.Botley et al.65�72. Amsterdam and Atlanta: Rodopi.

Dickens A. and R.Salkie. 1996. �Comparing Bi-lingual Dictionaries with Parallel Corpus�.EURALEX�96 Proceedings, ed. by M.Gellers-tam et al. 551�560. Goeteborg: Goeteborg Uni-versity.

Dini L. and V.Di Tomasso. 1998. �Corpus Lin-guistics for Application Development�. Inter-national Journal of Corpus Linguistics 2(3):305�319.

Erjavec T. 1995. �Public Domain Generic Tools:An Overview�. Proceedings of the First Europe-an Seminar �Language Resources for LanguageTechnology �Tihany, Hungary, September 15�16, 1995, ed. by H.Rettig et al. 37�48.

Facchinetti R. 1998. �Drawbacks and Pitfalls ofMachine-Readable Texts for Linguistic Rese-arch�. International Journal of Corpus Linguis-tics 2(3):211�229.

Fillmore C.J. 1992. ��Corpus linguistics� or�Computer-aided armchair linguistics��. Di-rections in Corpus Linguistics. Proceedings ofNobel Symposium 82, Stockholm, 4�8 August1991, ed. by J.Svartvik. 35�60. Berlin: Moutonde Gruyter.

Greffenstette G. and F.Segoond. 1997. �Multi-lingual Natural Language Processing�. Inter-national Journal of Corpus Linguistics 1(2):153�162.

Greffenstette G. 1998. �The Future of Linguisticsand Lexicographers: Will there be Lexicographersin the yaer 3000?� EURALEX�98 Proceedings,ed. by T.Fontenelle et al., 25�42. Liege:Uni-versity of Liege.

Grumadienë L., V.Þilinskienë. 1997. �Ávadas�.Daþninis dabartinës raðomosios lietuviø kalbosþodynas (maþëjanèio daþnio tvarka).V�XXXIV.Vilnius.

Hutchins W.J. and H. Sommers. 1992. An Intro-duction to Machine Translation. London: Aca-demic press.

Jakaitienë E. 1988. Leksinë semantika. Vilnius:Mokslas.

Jaroðova A. 1997. �Parallel Corpora and Equi-valents not Found in Bilingual Dictionaries�.Proceedings of the Second European seminar�Language Applications for a Multilingual Eu-rope�. Kaunas, Lithuania, April 17�20, 1997,ed. by R.Marcinkevièienë et al. 69�76. Man-nheim/Kaunas: IDS/VDU.

LITERATÛRA

Page 55: Marcinkeviciene R. Tekstynu Lingvistika

6 1Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

Kalëdaitë V. 2000. �Savita lietuviðkoji BKB kon-strukcija�. Darbai ir Dienos 24: 75�81.

Kazlauskienë A. 2000. �Daiktavardþio kirèiuo-èiø daþnumas�. Darbai ir Dienos 24: 83�88.

Kennedy G. 1998. An Introduction to Corpus Lin-guistics. London/NewYork: Longman.

Klumper J. 2000. Muldi (Multi Lingual Databa-se Interface). Manual. Entschede/Kaunas.

Krauwer S. 1995. �Machine Translation: State ofArt, Trends and the User Perspective� Procee-dings of the first European seminar �LanguageResources for language Technology. �Tihany,Hungary, September 15�16, 1995, ed. by H.Ret-tig et al. 79�86.

Labutis V. 1998. Lietuviø kalbos sintaksë. Vil-nius: Vilniaus universiteto leidykla.

Leech G. and R. Fallon. 1992. �Computer cor-pora � what do they tell us about culture?�.ICAME Journal 16:29�50.

Levin B., Song, G. and B.T.Atkins. 1997. �Ma-king Sense of Corpus Data: A Case Study ofVerbs of Sound�. International Journal of Cor-pus Linguistics 1(2):23�64.

Ljung M. 1990. A Study of TEFL Vocabulary.Stockholm Studies in English 78. Stockholm:Almqvist and Wiksell.

Macijauskaitë I. 2000. �Dvi antonimø poros:mirtis�gimimas, mirtis�gyvenimas�. Darbai irDienos 24: 121�142.

Marcinkevièienë R. 1994. �Gyvosios kalbos et-nografija�. Sociolingvistika ir kalbos kultûra, 47�54. Vilnius: �Gimtoji kalba�.

Marcinkevièienë R. 1995. �Kolokacija: tyrimokryptys, metodai, mokyklos�. Lituanistica2:40�54.

Marcinkevièienë R. 1997a. �Klausimas dël klau-simo, arba kà gali kompiuterinis tekstynas�.Darbai ir Dienos 5:19�37.

Marcinkevièienë R. 1997b. �Seeming Tautolo-gies in Lithuanian�. E-Prime Anthology III, ed.by D.David Bourland et al. 253�270. Califor-nia: Concord.

Marcinkevièienë R. 1997c. �Tekstynø lingvisti-ka ir lietuviø kalbos tekstynas�. Lituanistica1(29):58�78.

Marcinkevièienë R. et al. (eds.) 1997. Procee-dings of the Second European seminar �LanguageApplications for a Multilingual Europe�. Kau-nas, Lithuania, April 17�20, 1997. Mannheim/Kaunas: IDS/VDU.

Marcinkevièienë R. 1998. �Happax Legomenaas a Platform for text Alignment�. Proceedingsof the Third European Seminar �Translation Equi-

valence�. Montecatini Terme, Italy, October 16�18, 1997, ed. by W.Teubert et al., 125�137.Mannheim: IDS/TWC.

Marcinkevièienë R. 1999a. �Treji vartai á Ðven-tàjá Raðtà�. Naujasis Þidinys 7/8:367�372.

Marcinkevièienë R. 1999b. �Atminties labirin-tuose. Kognityvinës ir tekstynø lingvistikossàveika�. Darbai ir Dienos 10(39):109�124.

Marcinkevièienë R. 1999c. � Paaugliø þodynas�.Knygø aidai 01�03:39�42.

Marcinkevièienë R. 2000a. �Patterns of wordusage in corpus linguistics�. Kalbotyra,49(3):71�80.

Marcinkevièienë R. 2000b. �Terminografija irtekstynas�. Terminologija 6:5�22.

Marcinkevièienë R. 2000c. �Kauno vardo ko-notacija (vardaþodþiø semantika)�. Kauno is-torijos metraðtis 2:137�146.

Marcinkevièienë R. 2000d. �Metaphors fromCollocations�. Paradigmatika, sintagmatika irkalbos funkcijos, 190�192. Kaunas: KHF.

Marcinkevièienë R. �The importance of the syn-tagmatic dimension in the multilingual lexi-cal database�. Atiduota spausdinti.

McEnery T. and A.Wilson. 1996. Corpus Lin-guistics. Edinburgh: University Press.

McEnery T. and M. Oakes. 2000. �Bilingual textalignment � an overview�. Multilingual Cor-pora in Teaching and Research, ed. by S.P.Bot-ley et al. 1�37. Amsterdam and Atlanta: Ro-dopi.

Meyer R., M.E.Okurowski and T.Hand. 2000.�Using authentic corpora and language toolsfor adult-centered learning�. Multilingual Cor-pora in Teaching and Research, ed. by S.P.Bot-ley et al. 86�91. Amsterdam and Atlanta: Ro-dopi.

Mikelionienë J. 2000. Naujoji lietuviø kalbos lek-sika. Daktaro disertacija. Kaunas: VDU.

Mikelionienë J. 2000. �Ðiuolaikiniai metodaikalbos naujovëms tirti�. Darbai ir Dienos 24:65�73.

Mönnink de I. 1999. �Combining Corpus andExperimental Data�. International Journal ofCorpus Linguistics 1(4):77�112.

Morton H.C. 1994. The Story of Webster�s Third:Philip Gove�s Controvercial Dictionary and itsCritics. Cambridge: Cambridge UniversityPress.

Orphin D. 2000. �Sleaze and corruption in thecorpus: using corpus linguistics methodolo-gy to study language and idealogy�. Forthco-ming.

Page 56: Marcinkeviciene R. Tekstynu Lingvistika

6 2 KALBOTYRA INFORMACINEI VISUOMENEI

Pearson J. 1998. Terms in Context. Amsterdam /Philadelphia: John Benjamins.

Pearson J. 2000. �Teaching terminology usingelectronic resources�. Multilingual Corpora inTeaching and Research, ed. by S.P.Botley et al.92�105. Amsterdam and Atlanta: Rodopi.

Peters C., E. Picchi and L.Biagini. �Parallel andcomparable bilingual corpora in language te-aching and learning�. Multilingual Corpora inTeaching and Research, ed. by S.P.Botley et al.73�85. Amsterdam and Atlanta: Rodopi.

Rettig H. et al. (eds). 1995. Proceedings of theFirst European seminar �Language Resources forLanguage Technology�. Tihany, Hungary, Sep-tember 15�16. 1995. Hungary.

Ryklienë A. 2000. �Bendravimas internetu: kal-bëjimas raðant�. Darbai ir Dienos 24: 99�107.

Rissanen M. 1992. �The diachronic corpus as awindow to the history of English�. Directionsin Corpus Linguistics. Proceedings of Nobel Sym-posium 82, Stockholm, 4�8 August 1991, ed. byJ.Svartvik. 185�205. Berlin: Mouton de Gruy-ter.

Salkie R. �Unlocking the power of the SME-MUC�. Multilingual Corpora in Teaching andResearch, ed. by S.P.Botley et al. 148�156.Amsterdam and Atlanta: Rodopi.

Savickienë I. 1999. Lietuvio vaiko daiktavardþiomorfologija. Daktaro diesertacija. Kaunas:VDU.

Savickienë I. 2000. �Linksniai ðnekamojoje kal-boje�. Darbai ir Dienos 24: 89�98.

Schmied J. and B.Fink. 2000. �Corpus-basedcontrastive lexicology: the case of English withand its German translation equivalents�. Mul-tilingual Corpora in Teaching and Research, ed.by S.P.Botley et al. 157�176. Amsterdam andAtlanta: Rodopi.

Schoenefeld D. 1999. �Corpus Linguistics andCognitivism�. International Journal of CorpusLinguistics 1(4):137�172.

Scott M. 1997. WordSmith Tools Manual. Version2, internetinis adresas http://www.liv.ac.uk/~ms2928/wordsmit.htm

Sigley R. 1997. �Text Categories and WhereYou Can Stick Them: A Crude Formality In-dex�. International Journal of Corpus Linguis-tics 2(2):199�238.

Simard M., G.Foster, M.L.Hannan, E.Macklo-vitch and P.Plamondon. 2000. �Bilingual textalignment: where do we draw the line?�. Mul-tilingual Corpora in Teaching and Research, ed.by S.P.Botley et al. 157�176. Amsterdam andAtlanta: Rodopi.

Simonavièiûtë S. 2000. Sinoniminës abstrakèiøjødaiktavardþiø grupës �siela, dvasia, sàmonë� reikð-miø tyrimas ir lyginimas. Magistro darbas. Kau-nas: VDU.

Sinclair J. McH. (ed.)1987. Looking Up. An ac-count of the COBUILD project in lexical compu-ting. London and Glasgow: Collins ELT.

Sinclair J. McH. 1991. Corpus, Concordance, Col-location. Oxford: Oxford university press.

Sinclair J. McH. 1996a. �The Empty Lexicon�.International Journal of Corpus Linguistics1(1):99�120.

Sinclair J. McH. 1996b. �The Search for Units ofMeaning� . Textus IX 1:75�106.

Sinclair J. McH. 1997. �Language Engineeringand Informatics in Europe, 1988�2002�. Ms.

Sinclair J. McH. 1998. �A Way with CommonWords�. Out of Corpus. Studies in Honour ofStig Johansson, ed. by H.Hasselgard et al. Stu-dies in practical linguistics 26:157�175. Ams-terdam - Atlanta: Rodopi.

Sinclair J. McH. 1999a. �New roles for Langu-age Center: the mayonnaise problem�. Lan-guage Centres: Intergration through Innovation,ed. by D.Bickerton et al. 31�50. Plymouth:Cercles.

Sinclair J. McH. 1999b. �The Lexical Item�. Con-trastive Lexical Semantics, ed. by E.Weigand,vol. 17, Current Issues in Linguistic Theory.Amsterdam/Philadelphia: John Benjamins.

Sinclair J. McH. 2000a. �Current Issues in Cor-pus Linguistics� Ms.

Sinclair J. McH. 2000b. �The Deification of In-formation�. Patterns of Text: in Honour of Mi-chael Hoey, ed. by G.Thompson et al. forthco-ming. Amsterdam/Philadephia: John Benja-mins.

Sinclair J. McH. 2000c. �Lexical grammar�. Dar-bai ir Dienos 24:

Sliþienë N. 1994. �Þodyno sandara�. Lietuviøkalbos veiksmaþodþiø junglumo þodynas. Vilnius:Mokslo ir enciklopedijø leidykla.

Summers D. 1991. Longman/Lancaster EnglishLanguage corpus: Criteria and Design. Harlow:Longman.

Svartvik J. 1992. �Corpus linguistics comes ofage�. Directions in Corpus Linguistics. Procee-dings of Nobel Symposium 82, Stockholm, 4�8August 1991, ed. by J.Svartvik. 1�9. Berlin:Mouton de Gruyter.

Teubert W. 1996. �Comparable or Parallel Cor-pora?�. International Journal of Lexicography3(9):238�264.

Page 57: Marcinkeviciene R. Tekstynu Lingvistika

6 3Rûta Marcinkevièienë TEKSTYNØ LINGVISTIKA (TEORIJA IR PRAKTIKA)

Teubert W. 1996. �Editorial� . International Jour-nal of Corpus Linguistics 1(1):iii�x.

Teubert W. 1999. �Editorial: Corpus Linguis-tics � A Partisan View�. TELRI. Trans � Euro-pean Language Resources Infrastructure. New-sletter 8:4�19.

Teubert W., E.Tognini-Bonelli and N.Volz.(eds.).1998. Proceedings of the Third European Semi-nar �Translation Equivalence�. Montecatini Ter-me, Italy, October 16�18, 1997. Mannheim: IDS/TWC.

Tognini-Bonelli E. 1996. �Towards TranslationEquivalence from a Corpus Linguistics Per-spective�. International Journal of Lexicography3(9):197�217.

Tognini-Bonelli E. 2000. �Corpus ClassroomCurrency�. Darbai ir Dienos 24:

Utka A. 1998. �D.Orvelo romano 1984-ieji nag-rinëjimas, naudojant informacines technolo-gijas�. Informacinës technologijos ir universite-tinës studijos. Konferencijos praneðimø medþia-ga. 158�159. Kaunas:VDU.

Utka A. 1999. �Kà reiðkia mintis filosofinëjeliteratûroje?� Darbai ir Dienos 10(19):141�154.

Utka A. 2000. �Kalbinë programinë áranga irjos galimybës�. Darbai ir Dienos 24: 275�285.

Vaièenonienë J. 2000. �The Conduit Metaphorin English and Lithuanian: a Corpus-basedApproach�. Darbai ir Dienos 24: 143�167.

Vaièenonis J. 2000. �Dvi kariuomenës � dvejo-pi tyrimai�. Darbai ir Dienos 24: 183�190.

Van der Meer G. 1998. �Collocations as OneParticular Type of Conventional Word Com-binations. Their Definition and Character�.EURALEX�98 Proceedings, ed. by T.Fontenelleet al., 313�322. Liege:University of Liege.

Williams G. C. 1998. �Collocational Networks:Interlocking Patterns of Lexis of Plant Biolo-gy Research Articles�. International Journal ofCorpus Linguistics 1(3):151�172.

Zernic U. (ed.). 1991. Lexical acquisition: Exploi-ting on-line resources to build a lexicon. Hillsda-le, NJ: Lawrence Erlbaum.

Zinkevièius V. 2000. �Lemuoklis � morfologineianalizei�. Darbai ir Dienos 24: 246�273.

Þuperka K. 2000. �Kalbotyros terminai publi-cistikoje�. Darbai ir Dienos 24: 175�182.

Gauta 2000 12 15Parengta 2000 12 22

Rûta MARCINKEVIÈIENË

CORPUS LINGUISTICS IN THEORY AND PRACTICE

A b s t r a c t

PADËKAAutorë dëkoja Atviros Lietuvos fondui, Mokslo ir studijø fondui uþ suteiktà, o Valstybinës lietuviø kalboskomisijai prie Lietuvos Respublikos Seimo uþ dabar teikiamà paramà VDU tekstynui rengti.

The paper deals with a new trend in linguisticsthat appeared together with modern informationtechnologies and enabled linguists to accumulatehuge amounts of texts in order to compile elec-tronic corpora. It discusses the notion of a corpuswhich comprises two equally important parts: acollection of texts and tools for its processing. Thetypes of corpora are presented from the point ofview of their problematicity with the attempt toshow which members of several oppositions (suchas large vs. small, balanced or representative vs.unbalanced, dynamic vs. static, unanotated vs. an-otated) are more preferable than others. Lithua-nian corpora are discussed in a greater detail, es-pecially the corpus of present day Lithuanian atVytautas Magnus University (60 millions of run-ning words), as well as the tools used to process it.

Corpora are analysed with the help of the fre-quency lists, concordancies, collocational profiles,etc., which are used for linguistic applications.There is a discussion of a possibility to lemmatisea Lithuanian frequency list and the problem ofambiguity. With the aim of demonstrating speci-ficity of working with a Lithuanian concordance,one noun apatija (apathy) has been chosen, con-corded and analysed from the point of view ofusage. The functional meaning of the noun is pre-sented as the outcome of the analysis.Nowadays the status of corpus linguistics is

shifted from merely a methodology towards a dis-tinct approach to language description, thereforeits differencies and similarities in comparison toother trends to linguistics such as transformation-al grammar, cognitivism and the theory of valency

Page 58: Marcinkeviciene R. Tekstynu Lingvistika

6 4 KALBOTYRA INFORMACINEI VISUOMENEI

are presented. A greater prominence is given tothose theoretical assumptions which make corpuslinguistics a trend on its own right, i.e., the prin-ciple of idiomaticity, extended units of meaning,delexicalisation of the core vocabulary and inter-dependence of lexis and grammar.Corpus linguistics is compatible with a number

of branches of linguistics, such as lexicography, lex-icology, semantics, contrastive linguistics, the the-ory of translation, grammar, text and discourse anal-ysis, sociolinguistics, stylistics and the theory ofliterature, historical and applied linguistics. Other

fields in humanities such as the history of culture,philosophy, sociology and psychology can also benefitfrom using corpora for their research. But the great-est impact of corpus linguistics should be for therelated subjects of computational linguistics, artifi-cial intelligence and their technological applicationsin natural language processing and machine trans-lation.The final section of the paper is devoted to the

present and future role of corpus linguistics in theinformation society in general and the fate of na-tural human language in particular.

Mokslinis redaktorius habil.dr. Leonas GUDAITISMeninë redaktorë Rita PENKAUSKIENË

Pasiraðyta spausdinti 2000 12 27. Tiraþas 250 egz.Vytauto Didþiojo universiteto leidykla: Laisvës al. 53, 3000 Kaunas. SL 1557

Spausdino SPAB spaustuvë �Auðra�, Vytauto pr. 23, 3000 Kaunas. Uþsakymas 4157Redakcijos adresas: K.Donelaièio g. 52, 3000 Kaunas. Tel. 32 36 69

El.paðtas: [email protected]ë kaina