A számítógépes nyelvészet elmélete és gyakorlata
Tóth Enikő
http://lingua.arts.unideb.hu
fogadóóra: szerda, 9-10, 417.
Tematika
Bevezetés
A nyelv és a számítógép, történeti betekintés
Természetesnyelvi jelenségek – problémák a gépi feldolgozás számára
Formális nyelvek elmélete
Korpuszok
Különböző alkalmazások (Szekrényes István)
- Logikai programozás (Prolog)
- Beszédfeldolgozás (Praat)
- Reguláris kifejezések használata
A magyar nyelvre vonatkozó eredmények
Irodalom
Futó Iván (ed): Mesterséges intelligencia. Aula Kiadó, Budapest, 1999
Prószéky Gábor: Számítógépes nyelvészet. Számítástechnika-Alkalmazás Vállalat, Budapest, 1989
Prószéky Gábor – Kis Balázs: Számítógéppel emberi nyelven. Szak Kiadó, Budapest, 1999
Prószéky Gábor: A nyelvtechnológia (és) alkalmazásai. Budapest, Aranykönyv Kiadó, 2005
Bach Iván: Formális nyelvek. Typotex, Budapest, 2001
Mitkov, Ruslan (ed): The Oxford handbook of computational linguistics. OUP, 2004
http://szamitogepesnyelveszet.blogspot.hu/
http://www.mestersegesintelligencia.hu/
Irodalom:
Kis Balázs, Prószéky Gábor: A nyelv és a számítógép.
In: Kenesei István (ed): A nyelv és a nyelvek. Budapest, Akadémiai Kiadó, 2011
Babarczy Anna: Számítógépes nyelvészet.
In: Kovács Ilona & Szamarasz Vera Zoé (eds): Látás, nyelv, emlékezet. Budapest, Typotex, 2006
Prószéky – Olaszy – Váradi: Nyelvtechnológia
In: Kiefer Ferenc (ed): Magyar nyelv. Budapest, Akadémiai Kiadó, 2006
Bevezetés
számítógépes nyelvészet – nyelvtechnológia:
- műszaki tudomány, mely természetes nyelvű szövegek számítógépes feldolgozásával foglalkozik, az informatika hívta létre
- interdiszciplináris: informatika, matematika (formális nyelvek, automataelmélet, statisztika, halmazelmélet, stb.), nyelvészet
Történeti betekintés
Alan Turing 1950: a Turing teszt (gondolatkísérlet)
gépi fordítás/kódolás igénye – mesterséges intelligencia
60-as évek: a számítógépes fordítás
1. sokkal lassabb,
2. sokkal drágább,
3. sokkal rosszabb, mint a humán fordítás
a fejlődés megtorpan
Történeti betekintés
ELIZA ( J. Weizenbaum) 1966: pszicoterapeuta szimulálása
- A férfiak mind egyformák.
- Ezt hogy érted?
- Mindig nyaggatnak minket valamiért.
- Mondanál egy konkrét példát?
- Hát, a pasim küldött ide.
- A pasid küldött ide.
- Azt mondja, mindig depressziós vagyok.
- Sajnálom, hogy depressziós vagy.
- Talán ki kellene békülnöm az anyámmal.
- Mesélj még a családodról.
Történeti betekintés
hogyan működik?
– kulcsszó keresés: mindig, anyám
– kulcsszó aktivál egy szabályt: Mondanál egy konkrét példát? Mesélj még a családodról.
– reguláris kifejezések segítségével behelyettesítés a szabálynak megfelelően:
pasim -> pasid
reguláris kifejezés: egy olyan, bizonyos szintaktikai szabályok szerint leírt jelsorozat amivel meghatározható jelsorozatok egy halmaza.
– kulcsszavak rangsorolva vannak
http://psych.fullerton.edu/mbirnbaum/psych101/Eliza.htm
Történeti betekintés
Roger Schank (70-es évek) script rendszerek (forgatókönyv rendszerek)
Egy ember bement egy étterembe és rendelt egy hamburgert. Amikor a hamburger megérkezett, meg volt elégedve vele és amikor távozott, kifizette a számlát és sok borravalót hagyott.
Kérdés: Megette az ember a hamburgert?
Válasz: (Valószínűleg) igen.
„forgatókönyvek” élethelyzetekről
tipikus események részletes leírása: pl. étterem forgatókönyv:
– bemegyünk az étterembe
– a ruhatárban letesszük a kabátot
– kiválasztunk egy asztalt, stb.
Mai célok
Írott vagy beszélt nyelvi jelek automatikus gépi feldolgozása illetve produkciója
Feldolgozás:
– Ingerérzékelés (írott karakter, beszédhang, kézjelek)
– Elemzés
– Megértés
Produkció:
– Gondolat (mentális reprezentáció)
– Kódolás
- Megjelenítés
Egy példa – Herme (N. Campbell)
Herme és Him
Herme
Hivatkozások
Campbell, N.: “Hello?, Hi!”, managing contact. Talk presented at Interdisciplinary Workshop on Linguistic Annotation and Interaction Knowledge Systems, France, May 23-25th 2011
Babarczy Anna: Számítógépes nyelvészet.
In: Kovács Ilona & Szamarasz Vera Zoé (eds): Látás, nyelv, emlékezet. Budapest, Typotex, 2006
Köszönöm a figyelmet!