Top Banner
Doc. dr. Daiva Vaišnienė 2012-09-27
24

Daivos Vaišnienės pristatymas (skaidrės)

Feb 14, 2017

Download

Documents

ngocong
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Daivos Vaišnienės pristatymas (skaidrės)

Doc. dr. Daiva Vaišnienė2012-09-27

Page 2: Daivos Vaišnienės pristatymas (skaidrės)
Page 3: Daivos Vaišnienės pristatymas (skaidrės)

Ortografinis ir gramatinis labiausių paplitusių kalbų standartizavimas suteikė galimybių sparčiau plisti naujoms mokslinėms ir intelektinėms idėjoms;

Bendrinių kalbų susiformavimas suteikė piliečiams galimybių bendrauti tam tikruose (dažniausiai politinių valstybių sienų apibrėžtuose) plotuose;

Kalbų mokymas ir vertimai iš vienos kalbos į kitą suteikė galimybių keistis informacija skirtingomis kalbomis;

Redagavimo ir bibliografinės gairės užtikrino spausdintos informacijos kokybę ir prieinamumą;

Skirtingų žiniasklaidos priemonių – laikraščių, radijo, televizijos, knygų ir kitokių – atsiradimas tenkino skirtingus komunikavimo poreikius.

Page 4: Daivos Vaišnienės pristatymas (skaidrės)

Kompiuterinė programinė įranga pakeitė spausdinimą mašinėle ir rankinį tekstų rinkimą;

Programa Microsoft PowerPoint pakeitė projektoriumi rodomas skaidres;

Elektroniniu paštu siųsti ir gauti dokumentus galime sparčiau nei faksu;

Programa Skype teikia galimybę pigiai skambinti internetu ir rengti virtualius susitikimus;

Garso ir vaizdo kodavimo formatai palengvina daugialypės terpės turinio keitimą;

Paieškos sistemos teikia galimybių naudojant esminius žodžius pasiekti reikiamus tinklalapius;

Internetinės paslaugos, tokios kaip Google Translate teikia galimybių sparčiai, nors ir ne visada tiksliai, versti tekstus;

Socialinės terpės, tokios kaip Facebook, Twitter ir Google+, lengvina bendravimą, bendradarbiavimą ir keitimąsi informacija.

Page 5: Daivos Vaišnienės pristatymas (skaidrės)

57 proc. interneto naudotojų Europoje perka prekes ir paslaugas ne savo gimtąja kalba (anglų kalba yra labiausiai paplitusi užsienio kalba, po jos – prancūzų, vokiečių ir ispanų kalbos);

55 proc. naudotojų skaito internete pateikiamą informaciją užsienio kalbomis;

vos 35 proc. užsienio kalbomis rašo elektroninius laiškus arba komentarus interneto tinklalapiuose...

Page 6: Daivos Vaišnienės pristatymas (skaidrės)

Rasti informacijos naudojantis internetinės paieškos sistema;

Patikrinti, ar tekste nėra rašybos, skyrybos ir gramatinių klaidų;

Peržiūrėti produktų rekomendacijas internetinėje parduotuvėje;

Suprasti automobilio navigacinės sistemos žodines instrukcijas;

Versti tinklalapius naudojant internetines programas.

Page 7: Daivos Vaišnienės pristatymas (skaidrės)

Lietuvių kalba yra valstybės ir jos gyventojų bendravimo priemonė visose viešojo gyvenimo srityse, vienas svarbiausių valstybės suverenumo ir vientisumo požymių.

Lietuvių kalbos politika turi tenkinti visuomenės, įskaitant ir užsienyje gyvenančius tautiečius, socialinės, nacionalinės ir kultūrinės vienybės poreikį.

Lietuvių kalbos politika turi derėti su Europos Sąjungos kalbų politika, skatinančia išlaikyti daugiakultūrės Europos kalbų įvairovę, laikomą viena didžiausių Europos vertybių.

Lietuvių kalbos politika turi ugdyti sąmoningą ir kūrybišką visuomenės požiūrį į lietuvių kalbos vartojimą, lietuvių kalbos vertės ir savitumo suvokimą.

Lietuvių kalbos tarmės yra lietuvių kalbos ir kultūros turtas, todėl yra saugotinos ir palaikytinos.

Valstybinės kalbos politika turi apimti komunikacijos sistemas, skirtas specialiųjų poreikių turintiems žmonėms.

Lietuvių kalbos plėtros prioritetai – skaitmeninės kalbos sistemos ir ištekliai internete. Lietuvių kalba turi plėtotis kaip Europos Sąjungos daugiakalbių terminologinių bei vartojimo išteklių sudedamoji dalis. Automatinis vertimas iš / į lietuvių kalbą – svarbi kalbos vartojimo Europos Sąjungos erdvėje sudedamoji dalis.

Page 8: Daivos Vaišnienės pristatymas (skaidrės)

A Network of Excellence forging the

Multilingual Europe Technology Alliance

Baltic and Nordic Branch of the European

Open Linguistic Infrastructure

META-NET PROJEKTASMETA-NET PROJEKTAS

www.meta-net.euProjekto objektas - 8 Europos kalbos, turinčios mažiau nei po 10 milijonų kalbėtojų: danų, estų, suomių, islandų, latvių, lietuvių, norvegų ir švedų.

Page 9: Daivos Vaišnienės pristatymas (skaidrės)

--NET PROJEKTO TIKSLAINET PROJEKTO TIKSLAI

Projekto pagrindinė idėja – daugiakalbė Europa, išlaikydama ir puoselėdama kalbų įvairovę, sutelkia informacines technologijas ir kalbų išteklius į vieną informacinę erdvę bei rinką.

Tikslas - plėtoti technologinius daugiakalbės Europos informacinės visuomenės pagrindus: kurti bendruomenę, kurią jungtų bendra vizija ir

strateginiai mokslinių tyrimų tikslai; sukurti atviros prieigos išteklių ir technologijų

infrastruktūrą; plėtoti ryšius tarp technologinių sričių, susijusių su

kalba.

Page 10: Daivos Vaišnienės pristatymas (skaidrės)

--NETO DALYVIAINETO DALYVIAI

1. Airija2. Austrija 3. Belgija4. Bulgarija5. Čekija6. Danija7. Estija8. Graikija9. Islandija10. Ispanija11. Italija12. Jungtinė Karalystė13. Kipras14. Kroatija15. Latvija

16. Lenkija17. Lietuva18. Liuksemburgas19. Malta20. Norvegija21. Olandija22.Portugalija23. Prancūzija24. Rumunija25. Serbija26. Slovakija27. Slovėnija28. Suomija29. Švedija30. Vengrija31. Vokietija

Page 11: Daivos Vaišnienės pristatymas (skaidrės)

BŪKLĖS APŽVALGABŪKLĖS APŽVALGA (I) (I)

Lietuvių kalba Europos informacinėje visuomenėje: Pagrindiniai faktai apie kalbą (kalbėtojų skaičius,

statusas ir pan.); Kalbos ypatumai (gramatinės struktūros

sudėtingumas ir pan.); Valstybės parama kalbos vartojimui ir tyrimams

(institucijos, programos ir pan.); Kalbos vartojimas švietimo srityje (kitakalbių

mokymas, mokomųjų programų lokalizavimas ir pan.);

Kalbos vartojimas internete (domenų skaičius, atvirai prieinami ištekliai ir pan.)

Page 12: Daivos Vaišnienės pristatymas (skaidrės)

BŪKLĖS APŽVALGABŪKLĖS APŽVALGA (II) (II)

Kalbos technologijos: Paieškos technologijos; Tikrintuvai; Garso technologijos; Automatinis vertimas; Informacijos tvarkybos technologijos; Interaktyvios sistemos ir kitos technologijos

(ryšio technologijos, žaidimai, nuotolinio mokymo programos, lokalizavimas, išteklių skaitmeninimas ir pan.)

Kalbos technologijų industrija ir programos

Page 13: Daivos Vaišnienės pristatymas (skaidrės)

BŪKLĖS APŽVALGABŪKLĖS APŽVALGA (III) (III)

Tyrimų institucijos ir specialistų rengimas (tyrimų centrų, specialistų skaičius, universitetų programos, absolventų skaičius ir pan.)

Įrankių ir išteklių būklės įvertinimas (pagal standartizuotą formą)

Page 14: Daivos Vaišnienės pristatymas (skaidrės)

Puikus palaikymas

Geras palaikym

as

Vidutinis palaikymas

Fragmentiškas palaikymas

anglųanglų čekųčekųolandųolandųsuomiųsuomiųprancūzųprancūzųvokiečiųvokiečiųitalųitalųportugalųportugalųispanųispanų

baskųbaskųbulgarųbulgarųkatalonųkatalonųdanųdanųestųestųgalisųgalisųgraikųgraikųvengrųvengrųairiųairiųnorvegųnorvegųlenkųlenkųserbųserbųslovakųslovakųslovėnųslovėnųšvedųšvedų

ŠnekamosiosŠnekamosios kalbos kalbos apdorojimasapdorojimas Menkas / nėra Menkas / nėra

palaikymopalaikymo

kroatųkroatųislandųislandųlatvių latvių

lietuviųmaltiečiųmaltiečiųrumunųrumunų

Page 15: Daivos Vaišnienės pristatymas (skaidrės)

Automatinis vertimasAutomatinis vertimasMenkas/ nėra Menkas/ nėra

palaikymopalaikymobaskųbaskųbulgarųbulgarųkroatųkroatųčekų čekų danųdanųestųestųsuomiųsuomiųgalisųgalisųgraikųgraikųairiųairiųislandųislandųlatvių latvių

lietuviųmaltiečiųmaltiečiųnorvegųnorvegųportugalųportugalųserbųserbųslovakųslovakųslovėnųslovėnųšvedųšvedų

Puikus palaikymas

Geras palaikym

as

Vidutinis palaikymas

Fragmentiškas palaikymas

anglųanglų prancūzųprancūzųispanųispanų

vokiečiųvokiečiųitalų italų KatalonųKatalonųolandųolandųlenkųlenkųrumunųrumunųvengrųvengrų

Page 16: Daivos Vaišnienės pristatymas (skaidrės)

Puikus palaikymas

Geras palaikym

as

Vidutinis palaikymas

Fragmentiškas palaikymas Fragmentiškas palaikymas

anglųanglų olandųolandųprancūzųprancūzųvokiečiųvokiečiųitalųitalųispanųispanų

baskųbaskųbulgarų bulgarų katalonųkatalonųčekų čekų danųdanųsuomiųsuomiųgalisųgalisųgraikųgraikųvengrųvengrųnorvegųnorvegųlenkųlenkųportugalųportugalųrumunųrumunųslovakųslovakųslovėnųslovėnųšvedųšvedų

Teksto analizėTeksto analizė

Menkas/ nėra Menkas/ nėra palaikymopalaikymo

kroatųkroatųestųestųairiųairiųkroatųkroatųislandųislandųlatvių latvių

lietuviųmaltiečiųmaltiečiųserbųserbų

Page 17: Daivos Vaišnienės pristatymas (skaidrės)

Puikus palaikymas

Geras palaikyma

s

Vidutinis palaikymas

Vidutinis palaikymas

anglųanglų čekų čekų olandųolandųprancūzųprancūzųvokiečiųvokiečiųvengrųvengrųitalųitalųlenkų lenkų ispanųispanųšvedųšvedų

baskųbaskųbulgarų bulgarų katalonųkatalonųkroatųkroatųdanųdanųestųestųsuomiųsuomiųgalisųgalisųgraikųgraikųnorvegųnorvegųportugalųportugalųrumunųrumunųserbųserbųslovakųslovakųslovėnųslovėnų

Kalbos ir teksto ištekliaiKalbos ir teksto ištekliai

Menkas/ nėra Menkas/ nėra palaikymopalaikymo

islandųislandųairiųairiųlatvių latvių

lietuviųmaltiečiųmaltiečių

Page 18: Daivos Vaišnienės pristatymas (skaidrės)

Kiekybė

Prieinamum

as Kokybė

Aprėptis

Išbaigtumas

Tvarumas

Pritaikomum

as

Kalbos technologijos (įrankiai, technologijos ir pritaikymo sprendiniai)

Kalbos atpažinimas 2 0 2 1 1 0 2

Kalbos sintezė 3 2 2,5 2,5 3 3 3

Gramatinė analizė 2 1,5 2,5 2 1,5 1 2

Semantinė analizė 1,3 1 1,3 1 0 0 0,3

Kalbos generavimas 0 0 0 0 0 0 0

Automatinis vertimas 2 3 2,5 2,5 2 2 2

Page 19: Daivos Vaišnienės pristatymas (skaidrės)

Kiekybė

Prieinamum

as

Kokybė

Aprėptis

Išbaigtumas

Tvarumas

Prieinamum

as

Kalbos ištekliai (ištekliai, duomenys ir žinių bazės)

Tekstynai 1,5 1,5 2,5 2,5 2 2,5 2,5

Garsynai 2 1 2 2 1 1 2

Lygiagretieji tekstynai 2 2 1,5 1,5 2 2 4

Leksikos ištekliai 2,5 2 2,5 2 2 0,5 2,5

Gramatikos 0 0 0 0 0 0 0

Page 20: Daivos Vaišnienės pristatymas (skaidrės)

Išvados (I)• Moksliniai tyrimai leido sėkmingai sukurti gana

kokybišką programinę įrangą bazinei teksto analizei, tačiau pažangesnių technologijų, kurioms reikia nuodugnesnio lingvistinio apdorojimo ir semantinių žinių, kol kas tėra užuomazgos.

• Kuo daugiau lingvistinių ar semantinių žinių reikia sričiai plėtoti, tuo daugiau esama spragų, daugiau dėmesio reikia skirti išsamesniam lingvistiniam apdorojimui.

• Nors sukaupta neblogos kokybės specializuotų tekstynų ir garsynų, jie nepakankamai parengti, kai kurie iš jų pasiekiami tik naudojantis specializuotomis, individualiomis priemonėmis arba visai neturi prieigos.

Page 21: Daivos Vaišnienės pristatymas (skaidrės)

Išvados (II)• Nemaža dalis išteklių ir įrankių nestandartizuoti, jų

tvarumas nėra efektyvus, vadinasi, jų negalima laisvai panaudoti kitiems įrankiams kurti.

• Trūksta automatiniam vertimui skirtų lygiagrečiųjų tekstynų. Kol kas labiau išplėtotas vertimas iš lietuvių į anglų kalbą, kadangi šiai porai sukaupta daugiausia duomenų.

• Labai trūksta daugialypės terpės duomenų.

Page 22: Daivos Vaišnienės pristatymas (skaidrės)

Anotuoti (ar iš dalies anotuoti) tekstynai:Dabartinės lietuvių kalbos tekstynas; Akademinės lietuvių kalbos tekstynas; lygiagretieji tesktynai; Sakytinės lietuvių kalbos tekstynas ir kt.

Skaitmeniniai žodynai:•Vienakalbiai: Lietuvių kalbos žodynas, Dabartinės lietuvių kalbos žodynas;•Daugiakalbiai: Alkonas, Anglonas, Frankonas, LED, WinLED, “Tildės Biuras”, Cobuild, Etoile, ir kt.;•Specialieji: LR terminų bankas, Interleksis, ir kt.Garsynai:Sakytinės lietuvių kalbos garsynas, Tarmių archyvas, LRT žinių garsynas; ir kt.

Tekstynų apdorojimo įrankiai (konkordancijos, ir kt.); morfologinės analizės įrankiai; statistinės analizės įrankiai (dažnumų sąrašai, kalbos modeliai, ir pan..); kirčiuokliai; teklsto analizės įrankiai ir kt.

Rašybos tikrintuvai; morfologijos ir sintaksės analizatoriai;

Gramatikos tikrintuvai; semantinės anotacijos įrankiai; eksperimentinės ontologijos; šnekos sintezės įrankiai

Automatinis vertimas; mokomosios programos

(D. Vitkutė-Adžgauskienė, VDU)

Page 23: Daivos Vaišnienės pristatymas (skaidrės)

Lietuvių kalba informacinėje visuomenėje (2009–2013)

• Interneto vartai, leidžiantys atvirą prieigą prie visų per šią programą sukurtų kalbos išteklių ir technologijų.

• Tobulinimas esamų ir kūrimas naujų kalbos išteklių (skaitmeninių žodynų, mokymosi įrankių ir pan.)

• Šnekamosios kalbos atpažinimo ir sintezės įrankių tobulinimas ir diegimas į paslaugas.

• Naujų automatinio vertimo įrankių kūrimas: lietuvių–anglų–lietuvių, lietuvių–prancūzų–lietuvių.

• Semantinės ir sintaksinės analizės ir paieškos įrankių kūrimas ir tobulinimas.

Page 24: Daivos Vaišnienės pristatymas (skaidrės)