Doc. dr. Daiva Vaišnienė 2012-09-27
Doc. dr. Daiva Vaišnienė2012-09-27
Ortografinis ir gramatinis labiausių paplitusių kalbų standartizavimas suteikė galimybių sparčiau plisti naujoms mokslinėms ir intelektinėms idėjoms;
Bendrinių kalbų susiformavimas suteikė piliečiams galimybių bendrauti tam tikruose (dažniausiai politinių valstybių sienų apibrėžtuose) plotuose;
Kalbų mokymas ir vertimai iš vienos kalbos į kitą suteikė galimybių keistis informacija skirtingomis kalbomis;
Redagavimo ir bibliografinės gairės užtikrino spausdintos informacijos kokybę ir prieinamumą;
Skirtingų žiniasklaidos priemonių – laikraščių, radijo, televizijos, knygų ir kitokių – atsiradimas tenkino skirtingus komunikavimo poreikius.
Kompiuterinė programinė įranga pakeitė spausdinimą mašinėle ir rankinį tekstų rinkimą;
Programa Microsoft PowerPoint pakeitė projektoriumi rodomas skaidres;
Elektroniniu paštu siųsti ir gauti dokumentus galime sparčiau nei faksu;
Programa Skype teikia galimybę pigiai skambinti internetu ir rengti virtualius susitikimus;
Garso ir vaizdo kodavimo formatai palengvina daugialypės terpės turinio keitimą;
Paieškos sistemos teikia galimybių naudojant esminius žodžius pasiekti reikiamus tinklalapius;
Internetinės paslaugos, tokios kaip Google Translate teikia galimybių sparčiai, nors ir ne visada tiksliai, versti tekstus;
Socialinės terpės, tokios kaip Facebook, Twitter ir Google+, lengvina bendravimą, bendradarbiavimą ir keitimąsi informacija.
57 proc. interneto naudotojų Europoje perka prekes ir paslaugas ne savo gimtąja kalba (anglų kalba yra labiausiai paplitusi užsienio kalba, po jos – prancūzų, vokiečių ir ispanų kalbos);
55 proc. naudotojų skaito internete pateikiamą informaciją užsienio kalbomis;
vos 35 proc. užsienio kalbomis rašo elektroninius laiškus arba komentarus interneto tinklalapiuose...
Rasti informacijos naudojantis internetinės paieškos sistema;
Patikrinti, ar tekste nėra rašybos, skyrybos ir gramatinių klaidų;
Peržiūrėti produktų rekomendacijas internetinėje parduotuvėje;
Suprasti automobilio navigacinės sistemos žodines instrukcijas;
Versti tinklalapius naudojant internetines programas.
Lietuvių kalba yra valstybės ir jos gyventojų bendravimo priemonė visose viešojo gyvenimo srityse, vienas svarbiausių valstybės suverenumo ir vientisumo požymių.
Lietuvių kalbos politika turi tenkinti visuomenės, įskaitant ir užsienyje gyvenančius tautiečius, socialinės, nacionalinės ir kultūrinės vienybės poreikį.
Lietuvių kalbos politika turi derėti su Europos Sąjungos kalbų politika, skatinančia išlaikyti daugiakultūrės Europos kalbų įvairovę, laikomą viena didžiausių Europos vertybių.
Lietuvių kalbos politika turi ugdyti sąmoningą ir kūrybišką visuomenės požiūrį į lietuvių kalbos vartojimą, lietuvių kalbos vertės ir savitumo suvokimą.
Lietuvių kalbos tarmės yra lietuvių kalbos ir kultūros turtas, todėl yra saugotinos ir palaikytinos.
Valstybinės kalbos politika turi apimti komunikacijos sistemas, skirtas specialiųjų poreikių turintiems žmonėms.
Lietuvių kalbos plėtros prioritetai – skaitmeninės kalbos sistemos ir ištekliai internete. Lietuvių kalba turi plėtotis kaip Europos Sąjungos daugiakalbių terminologinių bei vartojimo išteklių sudedamoji dalis. Automatinis vertimas iš / į lietuvių kalbą – svarbi kalbos vartojimo Europos Sąjungos erdvėje sudedamoji dalis.
A Network of Excellence forging the
Multilingual Europe Technology Alliance
Baltic and Nordic Branch of the European
Open Linguistic Infrastructure
META-NET PROJEKTASMETA-NET PROJEKTAS
www.meta-net.euProjekto objektas - 8 Europos kalbos, turinčios mažiau nei po 10 milijonų kalbėtojų: danų, estų, suomių, islandų, latvių, lietuvių, norvegų ir švedų.
--NET PROJEKTO TIKSLAINET PROJEKTO TIKSLAI
Projekto pagrindinė idėja – daugiakalbė Europa, išlaikydama ir puoselėdama kalbų įvairovę, sutelkia informacines technologijas ir kalbų išteklius į vieną informacinę erdvę bei rinką.
Tikslas - plėtoti technologinius daugiakalbės Europos informacinės visuomenės pagrindus: kurti bendruomenę, kurią jungtų bendra vizija ir
strateginiai mokslinių tyrimų tikslai; sukurti atviros prieigos išteklių ir technologijų
infrastruktūrą; plėtoti ryšius tarp technologinių sričių, susijusių su
kalba.
--NETO DALYVIAINETO DALYVIAI
1. Airija2. Austrija 3. Belgija4. Bulgarija5. Čekija6. Danija7. Estija8. Graikija9. Islandija10. Ispanija11. Italija12. Jungtinė Karalystė13. Kipras14. Kroatija15. Latvija
16. Lenkija17. Lietuva18. Liuksemburgas19. Malta20. Norvegija21. Olandija22.Portugalija23. Prancūzija24. Rumunija25. Serbija26. Slovakija27. Slovėnija28. Suomija29. Švedija30. Vengrija31. Vokietija
BŪKLĖS APŽVALGABŪKLĖS APŽVALGA (I) (I)
Lietuvių kalba Europos informacinėje visuomenėje: Pagrindiniai faktai apie kalbą (kalbėtojų skaičius,
statusas ir pan.); Kalbos ypatumai (gramatinės struktūros
sudėtingumas ir pan.); Valstybės parama kalbos vartojimui ir tyrimams
(institucijos, programos ir pan.); Kalbos vartojimas švietimo srityje (kitakalbių
mokymas, mokomųjų programų lokalizavimas ir pan.);
Kalbos vartojimas internete (domenų skaičius, atvirai prieinami ištekliai ir pan.)
BŪKLĖS APŽVALGABŪKLĖS APŽVALGA (II) (II)
Kalbos technologijos: Paieškos technologijos; Tikrintuvai; Garso technologijos; Automatinis vertimas; Informacijos tvarkybos technologijos; Interaktyvios sistemos ir kitos technologijos
(ryšio technologijos, žaidimai, nuotolinio mokymo programos, lokalizavimas, išteklių skaitmeninimas ir pan.)
Kalbos technologijų industrija ir programos
BŪKLĖS APŽVALGABŪKLĖS APŽVALGA (III) (III)
Tyrimų institucijos ir specialistų rengimas (tyrimų centrų, specialistų skaičius, universitetų programos, absolventų skaičius ir pan.)
Įrankių ir išteklių būklės įvertinimas (pagal standartizuotą formą)
Puikus palaikymas
Geras palaikym
as
Vidutinis palaikymas
Fragmentiškas palaikymas
anglųanglų čekųčekųolandųolandųsuomiųsuomiųprancūzųprancūzųvokiečiųvokiečiųitalųitalųportugalųportugalųispanųispanų
baskųbaskųbulgarųbulgarųkatalonųkatalonųdanųdanųestųestųgalisųgalisųgraikųgraikųvengrųvengrųairiųairiųnorvegųnorvegųlenkųlenkųserbųserbųslovakųslovakųslovėnųslovėnųšvedųšvedų
ŠnekamosiosŠnekamosios kalbos kalbos apdorojimasapdorojimas Menkas / nėra Menkas / nėra
palaikymopalaikymo
kroatųkroatųislandųislandųlatvių latvių
lietuviųmaltiečiųmaltiečiųrumunųrumunų
Automatinis vertimasAutomatinis vertimasMenkas/ nėra Menkas/ nėra
palaikymopalaikymobaskųbaskųbulgarųbulgarųkroatųkroatųčekų čekų danųdanųestųestųsuomiųsuomiųgalisųgalisųgraikųgraikųairiųairiųislandųislandųlatvių latvių
lietuviųmaltiečiųmaltiečiųnorvegųnorvegųportugalųportugalųserbųserbųslovakųslovakųslovėnųslovėnųšvedųšvedų
Puikus palaikymas
Geras palaikym
as
Vidutinis palaikymas
Fragmentiškas palaikymas
anglųanglų prancūzųprancūzųispanųispanų
vokiečiųvokiečiųitalų italų KatalonųKatalonųolandųolandųlenkųlenkųrumunųrumunųvengrųvengrų
Puikus palaikymas
Geras palaikym
as
Vidutinis palaikymas
Fragmentiškas palaikymas Fragmentiškas palaikymas
anglųanglų olandųolandųprancūzųprancūzųvokiečiųvokiečiųitalųitalųispanųispanų
baskųbaskųbulgarų bulgarų katalonųkatalonųčekų čekų danųdanųsuomiųsuomiųgalisųgalisųgraikųgraikųvengrųvengrųnorvegųnorvegųlenkųlenkųportugalųportugalųrumunųrumunųslovakųslovakųslovėnųslovėnųšvedųšvedų
Teksto analizėTeksto analizė
Menkas/ nėra Menkas/ nėra palaikymopalaikymo
kroatųkroatųestųestųairiųairiųkroatųkroatųislandųislandųlatvių latvių
lietuviųmaltiečiųmaltiečiųserbųserbų
Puikus palaikymas
Geras palaikyma
s
Vidutinis palaikymas
Vidutinis palaikymas
anglųanglų čekų čekų olandųolandųprancūzųprancūzųvokiečiųvokiečiųvengrųvengrųitalųitalųlenkų lenkų ispanųispanųšvedųšvedų
baskųbaskųbulgarų bulgarų katalonųkatalonųkroatųkroatųdanųdanųestųestųsuomiųsuomiųgalisųgalisųgraikųgraikųnorvegųnorvegųportugalųportugalųrumunųrumunųserbųserbųslovakųslovakųslovėnųslovėnų
Kalbos ir teksto ištekliaiKalbos ir teksto ištekliai
Menkas/ nėra Menkas/ nėra palaikymopalaikymo
islandųislandųairiųairiųlatvių latvių
lietuviųmaltiečiųmaltiečių
Kiekybė
Prieinamum
as Kokybė
Aprėptis
Išbaigtumas
Tvarumas
Pritaikomum
as
Kalbos technologijos (įrankiai, technologijos ir pritaikymo sprendiniai)
Kalbos atpažinimas 2 0 2 1 1 0 2
Kalbos sintezė 3 2 2,5 2,5 3 3 3
Gramatinė analizė 2 1,5 2,5 2 1,5 1 2
Semantinė analizė 1,3 1 1,3 1 0 0 0,3
Kalbos generavimas 0 0 0 0 0 0 0
Automatinis vertimas 2 3 2,5 2,5 2 2 2
Kiekybė
Prieinamum
as
Kokybė
Aprėptis
Išbaigtumas
Tvarumas
Prieinamum
as
Kalbos ištekliai (ištekliai, duomenys ir žinių bazės)
Tekstynai 1,5 1,5 2,5 2,5 2 2,5 2,5
Garsynai 2 1 2 2 1 1 2
Lygiagretieji tekstynai 2 2 1,5 1,5 2 2 4
Leksikos ištekliai 2,5 2 2,5 2 2 0,5 2,5
Gramatikos 0 0 0 0 0 0 0
Išvados (I)• Moksliniai tyrimai leido sėkmingai sukurti gana
kokybišką programinę įrangą bazinei teksto analizei, tačiau pažangesnių technologijų, kurioms reikia nuodugnesnio lingvistinio apdorojimo ir semantinių žinių, kol kas tėra užuomazgos.
• Kuo daugiau lingvistinių ar semantinių žinių reikia sričiai plėtoti, tuo daugiau esama spragų, daugiau dėmesio reikia skirti išsamesniam lingvistiniam apdorojimui.
• Nors sukaupta neblogos kokybės specializuotų tekstynų ir garsynų, jie nepakankamai parengti, kai kurie iš jų pasiekiami tik naudojantis specializuotomis, individualiomis priemonėmis arba visai neturi prieigos.
Išvados (II)• Nemaža dalis išteklių ir įrankių nestandartizuoti, jų
tvarumas nėra efektyvus, vadinasi, jų negalima laisvai panaudoti kitiems įrankiams kurti.
• Trūksta automatiniam vertimui skirtų lygiagrečiųjų tekstynų. Kol kas labiau išplėtotas vertimas iš lietuvių į anglų kalbą, kadangi šiai porai sukaupta daugiausia duomenų.
• Labai trūksta daugialypės terpės duomenų.
Anotuoti (ar iš dalies anotuoti) tekstynai:Dabartinės lietuvių kalbos tekstynas; Akademinės lietuvių kalbos tekstynas; lygiagretieji tesktynai; Sakytinės lietuvių kalbos tekstynas ir kt.
Skaitmeniniai žodynai:•Vienakalbiai: Lietuvių kalbos žodynas, Dabartinės lietuvių kalbos žodynas;•Daugiakalbiai: Alkonas, Anglonas, Frankonas, LED, WinLED, “Tildės Biuras”, Cobuild, Etoile, ir kt.;•Specialieji: LR terminų bankas, Interleksis, ir kt.Garsynai:Sakytinės lietuvių kalbos garsynas, Tarmių archyvas, LRT žinių garsynas; ir kt.
Tekstynų apdorojimo įrankiai (konkordancijos, ir kt.); morfologinės analizės įrankiai; statistinės analizės įrankiai (dažnumų sąrašai, kalbos modeliai, ir pan..); kirčiuokliai; teklsto analizės įrankiai ir kt.
Rašybos tikrintuvai; morfologijos ir sintaksės analizatoriai;
Gramatikos tikrintuvai; semantinės anotacijos įrankiai; eksperimentinės ontologijos; šnekos sintezės įrankiai
Automatinis vertimas; mokomosios programos
(D. Vitkutė-Adžgauskienė, VDU)
Lietuvių kalba informacinėje visuomenėje (2009–2013)
• Interneto vartai, leidžiantys atvirą prieigą prie visų per šią programą sukurtų kalbos išteklių ir technologijų.
• Tobulinimas esamų ir kūrimas naujų kalbos išteklių (skaitmeninių žodynų, mokymosi įrankių ir pan.)
• Šnekamosios kalbos atpažinimo ir sintezės įrankių tobulinimas ir diegimas į paslaugas.
• Naujų automatinio vertimo įrankių kūrimas: lietuvių–anglų–lietuvių, lietuvių–prancūzų–lietuvių.
• Semantinės ir sintaksinės analizės ir paieškos įrankių kūrimas ir tobulinimas.