Top Banner
Latviešu valoda jaunajās tehnoloģijās Raivis Skadiņš un Inguna Skadiņa
69

ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Feb 07, 2017

Download

Technology

janisgrabis1
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Latviešu valoda jaunajās tehnoloģijās

Raivis Skadiņš un Inguna Skadiņa

Page 2: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

KAS IR TILDE?

Page 3: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Nodrošinātlatviešu valodai

tādu pašu atbalstu jaunajās tehnoloģijās kā plaši lietotām valodām

Kas ir Tilde?

Page 4: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Darbības virzieni un kompetence

Tulkošanas tehnoloģijas

Terminoloģijas risinājumi

Runas tehnoloģijas

Multimodāli virtuālie asistenti

Pareizrakstības līdzekļi

Mācību līdzekļi

Valodas resursi

• 6 zinātņu doktori, 2 doktoranti

• Aktīva dalība starptautiskās valodas tehnoloģiju organizācijās un projektos

• Vairāk nekā 120 zinātniskās publikācijas starptautisko konferenču rakstu krājumos

Page 5: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

• Dalība ES līdzfinansētos pētniecības projektos kopš 2002. gada

• Tilde ir piedalījusies vai piedalās 14 projektos

• Vadījusi 5 projektus

Eiropas mēroga pētniecības aktivitātes

Page 6: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Sadarbība

vairāk nekā 40 sadarbības partneru

Page 7: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

LATVIEŠU VALODA JAUNAJĀS TEHNOLOĢIJĀS

Page 8: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Kā Pēcis Beisikānis Maiju Saprātiņu programmēt mācīja B.Martuzāns, 1986

Page 9: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Pirms neilga laika angļu valoda kalpoja par saziņas valodu tīmeklī, jo lielākā daļa satura bija angļu valodā.

Tagad tīmekļa satura apjoms citās valodās ir strauji pieaudzis

Bet kā ar tehnoloģijām, kas “saprot” un prot lietot valodu?

Valodu tehnoloģiju iespējas un izaicinājumi

Page 10: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

DIGITĀLĀS TEKSTU KRĀTUVESNevienam nerada šaubas nepieciešamība veidot digitālās resursu krātuves, kurās apkopota gan runātā, gan rakstītā valoda

Page 11: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Digitālā bibliotēka

Page 12: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

http://www.korpuss.lv/senie/

Page 13: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

saeima.korpuss.lv

Page 14: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

http://letonika.lv/literatura

Page 15: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"
Page 16: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

PAMATTEHNOLOĢIJAS

Page 17: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Valodas tehnoloģiju iespējas

Valodas tehnoloģijas kļuvušas par mūsu ikdienu

– lietojam meklēšanas rīkus

– uzticamies pareizrakstības pārbaudes rīkiem

– klausāmies automašīnas navigācijas sistēmas mutiskās norādes

– vēlamies uzticamus tulkošanas rīkus

Page 18: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Pareizrakstības pārbaude

• Parasti izceļ kļūdaini uzrakstītus vārdus un piedāvā labojumus

• Pareizrakstības pārbaudes rīki atrod arī sintakses kļūdas

Page 19: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

• Pareizas sintakses likumsCSENT -> main:SENT pm:T cc:C cc:SENT

cc:C.ConjType==Coord

pm:T.PunctType==comma

• Kļūdainas sintakses likumsDESCR "Pieturzīmes kļūda"

ERROR-6 -> main:SENT cc:C cc:SENT

cc:C.ConjType==Coord

GRAMMCHECK MarkSpaceBefore(cc:C)

SUGGEXPLAN "Starp divām patstāvīgām teikuma daļām ir jāliek komats"

SUGGEST (","+cc:C)

Pareizas un kļūdainas sintakses likumu pāris

Page 20: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

AUTOMATIZĒTA TULKOŠANA

Page 21: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Latvijas iedzīvotāji nelasa vai reti lasa informāciju Internetā,

ja tā nav dzimtajā valodā

46%

Page 22: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Latvijas nodarbinātie iedzīvotāji neveic vai reti veic profesionālo komunikāciju Internetā, ja tā nav dzimtajā valodā

64%

Page 23: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Statistiskās MT sistēmas

1947. gada 4.martā Vorens Vīvers(Warren Weaver) Norbertam Vīneram(Norbert Wiener) vēstulē izklāsta idejupar datora izmantošanu tulkošanā

… Also knowing nothing official about, but having guessed and inferred considerable about, powerful new mechanized methods in cryptography... one naturally wonders if the problem of translation could conceivably be treated as a problem in cryptography. When I look at an article in Russian, I say: “This is really written in English, but it has been coded in some strange symbols. I will now proceed todecode.”...

Kad es redzu tekstu krieviski, es saku “Tas īstenībā ir rakstīts angliski, bet ir nokodēts ar dīvainiem simboliem. Es to atkodēšu”

23

Page 24: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Mašīntulkošana

Ideja par datoru izmantošanu dabiskās valodas teksta tulkošanā radās 1946. gadā

Mi pyeryedayem mislyi posryedstvom ryechi.

We transmit thoughts by means of speech.

Page 25: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Statistiskā MT iemācās tulkošanu no divu veidu datiem:• Cilvēka veiktajiem tulkojumiem

• Tekstiem mērķvalodā

• Jo vairāk datu, jo labāk

• Svarīgi, lai tie būtu piemēroti dati!

Kā darbojas mūsdienu MT?

25

Page 26: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Kā darbojas mūsdienu MT: trenēšana

Paralēlais korpuss(angļu-latviešu)

Korpuss mērķvalodā

(latviešu)

Tulkošanas modelisP(A|L)

Valodas modelisP(L)

26

Page 27: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Kā darbojas mūsdienu MT: tulkošana

Tulkošanas modelisP(A|L)

Valodas modelisP(L)

Teikums angļu valodā

Teikums latviešu valodā

Dekoderisargmaxl P(L)P(A|L)

27

Page 28: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Kurš teikums, ir kura tulkojums

Sastatījums teikuma līmenī

Take the cone on the square. Take the block.Take the green block.

Paņem konusu no kvadrāta.Paņem klucīti.Paņem zaļo klucīti.

Kā tulkojami vārdi un vārdu savienojumi

Vārdu sastatīšana, tulkojumu varbūtības

blockgreentake

klucītiszaļšpaņemt

Kāds ir pareizs teikums mērķvalodā

Valodas modelis Paņem zaļo klucīti.Paņem klucīti zaļo.

Ko dators iemācās no tekstiem?

28

Page 29: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Sastatīšana teikuma līmenī

29

Take the cube.

Take the green cube on the red circle.

Take the green cube,put the cube on the red

circle.

Put the cone on the red circle on the square.

Paņem kubu.

Paņem zaļo kubu no sarkanā apļa.

Noliec kubu uz sarkanā apļa.

Pārliec konusu no sarkanā apļa uz kvadrāta.

Paņem zaļo kubu.

William A. Gale and Kenneth Ward Church (1991): A PROGRAM FOR ALIGNING SENTENCES IN BILINGUAL CORPORA, Proceedings of the 29th Annual Meeting of the Association of Computational Linguistics (ACL)

Page 30: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Sastatīšana vārdu līmenī

http://www.lr-coordination.eu/sites/default/files/presentation/GER_workshop-master-S7a-Josef%20van%20Genabith-final-DE.pdf

Page 31: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Sastatīšana vārdu līmenī

31http://www.lr-coordination.eu/sites/default/files/presentation/GER_workshop-master-S7a-Josef%20van%20Genabith-final-DE.pdf

Page 32: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Vārdu tulkojumu izguve

32

Teikuma līmeņa sastatījums

Take the block. Paņem klucīti.

Take the green block. Paņem zaļo klucīti.

Take the red square. Paņem sarkano kvadrātu.

Put the square on the red block. Noliec kvadrātu uz sarkanā klucīša.

Put on the red square. Noliec uz sarkanā kvadrāta.

Page 33: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Vārdu tulkojumu izguve

33

Vārdu pāru biežumi

take paņem 3

klucīti 2

...

block klucīti 2

klucīša 1

green zaļo 1

red sarkano 1

sarkanā 2

on uz 2

put noliec 2

.....

Sastatījums

Take the block. Paņem klucīti.

Take the green block. Paņem zaļo klucīti.

Take the red square. Paņem sarkanokvadrātu.

Put the square onthe red block.

Noliec kvadrātu uzsarkanā klucīša.

Put on the redsquare.

Noliec uz sarkanākvadrāta.

Page 34: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Tulkošanas modelis

34

Put the red blockVārdu pāru biežumi

take paņem 3

klucīti 2

...

block klucīti 2

klucīša 1

green zaļo 1

red sarkano 1

sarkanā 2

on uz 2

put noliec 2

.....

?

Page 35: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Tulkošanas modelis

35

Put the red block

Vārdu pāru biežumi

take paņem 3

klucīti 2

...

block klucīti 2

klucīša 1

green zaļo 1

red sarkano 1

sarkanā 2

on uz 2

put noliec 2

.....

? Noliec sarkano klucīti2/2 1/3 1/3

Noliec sarkano klucīša2/2 1/3 1/3

Noliec sarkanā klucīti2/2 2/3 2/3

Noliec sarkanā klucīša2/2 2/3 1/3

Page 36: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Tulkošanas modelis

36

Put the red blockVārdu pāru biežumi

take paņem 3

klucīti 2

...

block klucīti 2

klucīša 1

green zaļo 1

red sarkano 1

sarkanā 2

on uz 2

put noliec 2

.....

?

Noliec sarkanā klucīti

Page 37: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Valodas modelis

37

• Kas ir laba valoda?• Kuri vārdi var kuriem sekot un kuri nevar?• Kādi ir pareizie locījumi?

Noliec sarkano klucīti

Noliec sarkano klucīša

Noliec sarkanā klucīti

Noliec sarkanā klucīša

Page 38: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Valodas modelis• Valodas modelis novērtē pārtulkoto vārdu virkni L, t.i.,

novērtē vai tas ir pareizs teikums P(L)• Valodas modeļa veidošanai izmanto lielus monolingvālus

tekstu korpusus• Lai noskaidrotu, kas ir “laba” vai “slikta” valoda, tiek

izmantoti valodas n-grammu modeļi, visbiežāk 3-grammas, 5-grammas, 7- grammas

P(noliec sarkano klucīti) P(noliec|teikuma sākums) *P(sarkano | teikuma sākums, noliec) *P(klucīti |noliec, sarkano) *P(teikuma beigas| noliec, sarkano) *P(teikuma beigas |sarkano)

38

Page 39: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Valodas modelis

39

• Kas ir laba valoda?• Kuri vārdi var kuriem sekot un kuri nevar?• Kādi ir pareizie locījumi?

Noliec sarkano klucīti2 0.1 0.1 0.1 0.1Noliec sarkano klucīša2 0.1 0.1 0. 1 0.1Noliec sarkanā klucīti2 0.1 0.1 0.1 0.1Noliec sarkanā klucīša2 0.1 0.1 1 1

Sastatījums

Take the block. Paņem klucīti.

Take the green block. Paņem zaļo klucīti.

Take the red square. Paņem sarkanokvadrātu.

Put the square onthe red block.

Noliec kvadrātu uzsarkanā klucīša.

Put on the redsquare.

Noliec uz sarkanākvadrāta.

Page 40: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Statistiskā mašīntulkošana

40

Vārdu pāru biežumi

take paņem 3

block klucīti 2

klucīša 1

green zaļo 1

red sarkano 1

sarkanā 2

...

+

Tulkojums mērķvalodā

Put the red block

Noliec sarkanā klucīša

Page 41: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Tulkošana

Paralēlais korpuss(angļu-latviešu)

Korpuss mērķvalodā

(latviešu)

Tulkošanas modelisP(A|L)

Valodas modelisP(L)

Teikums angļu valodā

Teikums latviešu valodā

Dekoderisargmaxl P(L)P(A|L)

41

Page 42: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

• Tulkojot vārdus, tiek zaudēts konteksts: piemēram, saskaņojums (paņem sarkanā klucīti …) u.c.

• Daļēji risina valodas modelis

• Labāks risinājums ir frāzēs balstīts modelis - ne tikai vārdu tulkojumi, bet arī frāžu tulkojumi

Frāzēs balstīta SMT

42

Page 43: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Statistiskā mašīntulkošana

43

Biežumu statistika

take paņem 4

block klucīti 2

klucīša 1

green zaļo 2

zaļā 1

red sarkano 1

sarkanā 2

on uz 3

put noliec 3

square kvadrāta 1

kvadrātu 2

Sastatījums

Take the block. Paņem klucīti.

Take the green block. Paņem zaļo klucīti.

Take the green square. Paņem zaļo kvadrātu.

Take the red square. Paņem sarkanokvadrātu.

Put the square on thered block.

Noliec kvadrātu uzsarkanā klucīša.

Put on the red square. Noliec uz sarkanākvadrāta.

Put on the green block. Noliec uz zaļā klucīša.

Page 44: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

44

Biežumu statistika

take paņem 4

block klucīti 2

klucīša 1

green zaļo 2

zaļā 1

red sarkano 1

sarkanā 2

on uz 3

put noliec 3

square kvadrāta 1

kvadrātu 2

Put the red square on thegreen block

Noliec sarkanā kvadrātu uz zaļo klucīti

Page 45: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Statistiskā mašīntulkošana

45

Biežumu statistika

the red square sarkano kvadrātu 1

on the green block uz zaļā klucīša 1

on the red squire uz sarkanā kvadrāta 1

put noliec 3

....

Sastatījums

Take the block. Paņem klucīti.

Take the green block. Paņem zaļo klucīti.

Take the green square. Paņem zaļo kvadrātu.

Take the red square. Paņem sarkano kvadrātu.

Put the square on the red block. Noliec kvadrātu uz sarkanā klucīša.

Put on the red square. Noliec uz sarkanā kvadrāta.

Put on the green block. Noliec uz zaļā klucīša.

Page 46: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Statistiskā mašīntulkošana

46

Noliec sarkano kvadrātu uz zaļā klucīša

Biežumu statistika

the red square sarkano kvadrātu 1

on the green block uz zaļā klucīša 1

on the red squire uz sarkanā kvadrāta 1

put noliec 3

Put the red square on the green block

Page 47: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Mašīntulkošanas sistēmas izveides soļi

47

Page 48: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

VALODU VIRZIENS JOMA BLEU

Angļu-latviešu Valsts pārvalde 55,58

Latviešu-angļu Valsts pārvalde 60,93

Latviešu-krievu Valsts pārvalde 65,88

Page 49: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Apsteigts Google un Microsoft: sasniegta

pasaulē labākā mašīntulkošanas kvalitāte

Baltijas valstu valodām

Page 50: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"
Page 51: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Skype Translator

51http://www.skype.com/en/translator-preview/

Page 52: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Neironu tīklu lietojums MT

Pašlaik vislabākie rezultāti

Pirmie eksperimentālie rezultāti

K. Stevens. Neural Networks and Google Translate: http://lectures.ms.mff.cuni.cz/view.php?rec=278

Valodas modeļu pārvērtēšana

52

Page 53: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

RUNAS TEHNOLOĢIJAS

Page 54: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Runas atpazīšanas korpuss

Ortogrāfiski marķēts latviešu valodas runas korpuss:– Ortogrāfiski marķēti dati (100 stundas)

– Fonētiski marķēti dati (4 stundas)

Page 55: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Runātās valodas korpuss

Sadalījums pa vecuma grupām

Page 56: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Balss atpazīšanas procesa izpēte

• Modelē akustiskās pārejas fonēmās un starp tām

• Modelēšana ar HMM modeli (HiddenMarkov Model)

• «Apmācīšana» uz transkribētiem balss datiem

Akustiskais modelis

Grafēmu-fonēmu modelis

Valodas modelis

• Modelē grafēmu izrunu

• Vienkāršākais modelis –izrunas vārdnīca

• Komplicētāki modeļi, piem., ar Finite StateTransducers

• Modelē iespējamo vārdu secību teikumā.

• Vienkāršākie modeļi ar CFG.

• Vispārējs varbūtisks valodas modelis ar n-grammām

Audiosignāla parametri-

zācija

• Attīra trokšņu un fona ietekmi

• Normalizē audiosignālu, līdzsvarojot akustiskos, tembrālos un tonālos parametrus

Page 57: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Balss atpazīšanas process

Speech signal

Feature extraction

Acoustic model

Languagemodel

Combining both models

Best hypothesis

𝑃 𝑎𝑐𝑜𝑢𝑠𝑡𝑖𝑐 𝑠𝑖𝑔𝑛𝑎𝑙|𝑇

𝑃(𝑇)

𝑎𝑟𝑔max𝑇

Page 58: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"
Page 59: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

VIRTUĀLIE SARUNU BIEDRI

Page 60: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Virtuālie sarunu biedri

Tjūringa tests (1950)

Page 61: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Arhitektūra

Runas atpazīšanas un runas sintēzes

tīmekļa pakalpojumiGoogle, Nuanse

iPhone

Android

Windows Phone

Ms Windows

Lietotāja iekārtas

Vairāku aģentu dialoga vadības

sistēma

Ārējās zināšanu bāzesĀrējās zināšanu

bāzesĀrējās zināšanu bāzes

text, ID, GPS, ...

text/xml, ID

Page 62: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Pirmais prototips: valūtas konvertors Ēriks

• Dialogsistēma ierobežotas lietošanas scenārijam.

• Eksperimentāla lietotne, kas palīdzēja Latvijas iedzīvotājiem vieglāk orientēties valūtas konvertācijas procesā 2014. gada pirmajos mēnešos, kad notika pāreja no latiem uz eiro.

• Pirmā multimodālā dialogsistēma, kas demonstrē skaitļu atpazīšanu runā latviešuvalodā.

Page 63: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Meklēšana tīmeklīKāds

šodien datums

?

Kurā vietā atrodas vaicātājs

Kur meklējamas laika ziņas?

Kāds būs laiks 24. februārī

Rīgā?

Kāds rīt būs laiks?

Page 64: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Laura• Dialogsistēma Laura ir virtuālā

sarunbiedra prototips.• Laura saprot vienkāršus

jautājumus angļu valodā un var sniegt atbildes uz tiem.

• Sarunas laikā pauž emocijas.

• Papildus prot arī: • Atbildēt par laikapstākļiem;• Noteikt attālumu;• Noteikt atrašanās vietu;• Tulkot no angļu valodas uz spāņu, krievu

un franču valodām u.tml.

Page 65: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Laura Riga Guide• Laura Riga Guide iepazīstina

lietotājus ar Rīgu un Latviju.

• Pielāgota saskarne; Papildus servisi iekļauj:

• Google Maps /Google Directions

• Foursquare

Page 66: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Mobils mācību palīglīdzeklis reizrēķina apguvei latviešu

valodā

Page 67: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Reizrēķins• Multimodālās dialogsistēmas

prototips Reizrēķins veidots kā spēle un palīgs bērniem reizrēķinazināšanu nostiprināšanai latviešuvalodā.

• Runas atpazīšana reālā laikā.

• Pauž emocijas atkarībā no atbildes pareizības.

• Interaktīvs 3D tēls.

Page 68: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

Multimodālā sapludināšana –emocionāls, bērnam saprotams

virtuālais tēls, kas reaģē atbilstoši situācijai

Page 69: ITI zinātniskais seminārs: Inguna Skadiņa un Raivis Skadiņš "Latviešu valoda jaunajās tehnoloģijās"

PALDIES PAR UZMANĪBU!

JAUTĀJUMI?