CARNEGIE MELLON CARNEGIE MELLON UNIVERSITY UNIVERSITY http:// www.cmu.edu /
CARNEGIE MELLON CARNEGIE MELLON UNIVERSITY UNIVERSITY
http://www.cmu.edu/
O SVEUČILIŠTUO SVEUČILIŠTU
► Andrew Carnegie, industrijalac i filantrop, osnovao je Andrew Carnegie, industrijalac i filantrop, osnovao je Carnegie Technical School 1900. godine u Pittsburghu. Carnegie Technical School 1900. godine u Pittsburghu. Njegova vizija bila je otvoriti školu za obrazovanje Njegova vizija bila je otvoriti školu za obrazovanje djece radničke klase u Pittsburghu.djece radničke klase u Pittsburghu.
► Škola je preimenovana 1912. godine u Škola je preimenovana 1912. godine u Carnegie Carnegie Institute of TechnologyInstitute of Technology
► 1967. godine Carnegie Institute of Technology se spojio 1967. godine Carnegie Institute of Technology se spojio sa sa Mellon Institutom u Mellon Institutom u Carnegie Mellon University
O SVEUČILIŠTUO SVEUČILIŠTU
► Danas je jedno od vodećih nacionalnih privatnih Danas je jedno od vodećih nacionalnih privatnih sveučilišta po sveučilišta po istraživanjuistraživanju, a vodeće je i na , a vodeće je i na tehnološkom tehnološkom području kao što su računalstvo, području kao što su računalstvo, robotika i inženjerstvorobotika i inženjerstvo
► Carnegie Mellon je poznato i kao pionir u uporabi Carnegie Mellon je poznato i kao pionir u uporabi računala u obrazovanjuračunala u obrazovanju
► Njihova računalna mreža "Andrew", koja je Njihova računalna mreža "Andrew", koja je dobila ime po osnivačima sveučilišta Andrew dobila ime po osnivačima sveučilišta Andrew Carnegie i Andrew Mellon, jedna je od Carnegie i Andrew Mellon, jedna je od najnaprednijih danasnajnaprednijih danas
O SVEUČILIŠTUO SVEUČILIŠTU
►Pohađa ga oko 7500 studenata, a na fakultetu Pohađa ga oko 7500 studenata, a na fakultetu radi oko 3000 ljudiradi oko 3000 ljudi
►Sveučilište je raznolika mješavina akademskih Sveučilište je raznolika mješavina akademskih disciplina, uključujući nacionalno priznate disciplina, uključujući nacionalno priznate programe: kognitivne psihologije, menadžmenta programe: kognitivne psihologije, menadžmenta i javne politike, retorike, povijesti, filozofije i i javne politike, retorike, povijesti, filozofije i drugih znanostidrugih znanosti
O SVEUČILIŠTUO SVEUČILIŠTU
Danas se Sveučilište sastoji od sedam fakulteta i škola:Danas se Sveučilište sastoji od sedam fakulteta i škola:1.1. CarnegieCarnegie Institute Institute ofof TechnologyTechnology (CIT) (CIT)2.2. CollegeCollege ofof Fine Fine ArtsArts (CFA) (CFA)3.3. College of Humanities and Social SciencesCollege of Humanities and Social Sciences (HSS) (HSS)4.4. Graduate School of Industrial AdministrationGraduate School of Industrial Administration (GSIA) (GSIA)5.5. H. John Heinz III School of Public Policy and ManagH. John Heinz III School of Public Policy and Manag
ementement (HEINZ) (HEINZ)
6.6. MellonMellon CollegeCollege ofof ScienceScience (MCS) i (MCS) i 7.7. SchoolSchool ofof ComputerComputer ScienceScience (SCS) (SCS)
SCHOOL OF COMPUTER SCHOOL OF COMPUTER SCIENCE (SCS)SCIENCE (SCS)
http://http://www.cs.cmu.eduwww.cs.cmu.edu//►Jedna od vodećih institucija za računalstvo u Jedna od vodećih institucija za računalstvo u
svijetu po istraživanjima i obrazovanjusvijetu po istraživanjima i obrazovanju►Rad u Rad u interdisciplinarnom okruženjuinterdisciplinarnom okruženju u u
jednom od tehnološki najsofisticiranijih jednom od tehnološki najsofisticiranijih postrojenja u svijetu, školski istraživači poznati postrojenja u svijetu, školski istraživači poznati su po: razvoju operativnih sustava, programskim su po: razvoju operativnih sustava, programskim jezicima, prijenosnim kompjuterima, mrežama i jezicima, prijenosnim kompjuterima, mrežama i robotimarobotima
Škola za računalstvo sastoji se od sedam Škola za računalstvo sastoji se od sedam odsjekaodsjeka, , centara i instituta:centara i instituta:
1.1. Centar za automatizirano učenje i otkrića (Centar za automatizirano učenje i otkrića (CenterCenter for Automated Learning and Discovery for Automated Learning and Discovery - CALD) - CALD)
2.2. Odsjek za računalstvo (Odsjek za računalstvo (Department of Computer ScienceDepartment of Computer Science - CSD) - CSD)
3.3. Centar za zabavnu tehnologiju (Centar za zabavnu tehnologiju (Entertainment Technology Entertainment Technology CenterCenter ) )
SCHOOL OF COMPUTER SCHOOL OF COMPUTER SCIENCESCIENCE
4.4. Međunarodni centar za istraživanje softvera (Međunarodni centar za istraživanje softvera (Institute for Software Research, InternationalInstitute for Software Research, International - - ISRI)ISRI)
5.5. Institut za interakciju čovjeka i računala (Institut za interakciju čovjeka i računala (Human Computer Interaction InstituteHuman Computer Interaction Institute - HCII) - HCII)
6.6. Institut za jezične tehnologijeInstitut za jezične tehnologije ( (Language Technologies InstituteLanguage Technologies Institute - LTI) - LTI)
7.7. Institut za robotiku (Institut za robotiku (Robotics InstituteRobotics Institute - RI) - RI)
LANGUAGE TECHNOLOGIES LANGUAGE TECHNOLOGIES INSTITUTEINSTITUTE (LTI)(LTI)
http://http://www.lti.cs.cmu.eduwww.lti.cs.cmu.edu//► Institut za jezične tehnologije nalazi se u sklopu Škole Institut za jezične tehnologije nalazi se u sklopu Škole
za računalstvo na Sveučilištu Carnegie Mellon. za računalstvo na Sveučilištu Carnegie Mellon. ► Institut je osnovan 1996. godine zbog ekspanzije Centra Institut je osnovan 1996. godine zbog ekspanzije Centra
za strojno prevođenje (za strojno prevođenje (Center for Machine Center for Machine TranslationTranslation – CMT), sada je CMT dio Instituta – CMT), sada je CMT dio Instituta
► Bavi se istraživanjima i obrazovanjem na područjima Bavi se istraživanjima i obrazovanjem na područjima jezičnih tehnologija i upravljanja informacijamajezičnih tehnologija i upravljanja informacijama
LANGUAGE TECHNOLOGIES LANGUAGE TECHNOLOGIES INSTITUTEINSTITUTE (LTI)(LTI)
► Institut pruža Institut pruža dodiplomske programe, magisterij iz dodiplomske programe, magisterij iz jezičnih tehnologija i doktorat iz jezika i jezičnih tehnologija i doktorat iz jezika i informacijskih tehnologijainformacijskih tehnologija
► DodiplomskiDodiplomski programi: bazirani su na obaveznim programi: bazirani su na obaveznim predmetima koji pokrivaju lingvističke i statističke predmetima koji pokrivaju lingvističke i statističke pristupe, osnove računalstva i područja primjene pristupe, osnove računalstva i područja primjene jezičnih tehnologija. Strojno prevođenje, pretraživanje jezičnih tehnologija. Strojno prevođenje, pretraživanje informacija i prepoznavanje govora posebno su informacija i prepoznavanje govora posebno su istaknuti.istaknuti.
LANGUAGE TECHNOLOGIES LANGUAGE TECHNOLOGIES INSTITUTEINSTITUTE (LTI)(LTI)
►MagisterijMagisterij iz jezičnih znanosti: nude se tri iz jezičnih znanosti: nude se tri područja: strojno prevođenje, pretraživanje područja: strojno prevođenje, pretraživanje informacija i prepoznavanje govora. informacija i prepoznavanje govora.
►DoktoratDoktorat iz jezika i informacijskih tehnologija: iz jezika i informacijskih tehnologija: izabire se jedno od područja jezičnih tehnologija izabire se jedno od područja jezičnih tehnologija ili računalne lingvistike.ili računalne lingvistike.
CENTER FOR MACHINECENTER FOR MACHINE TRANSLATION (CMT)TRANSLATION (CMT)
► http://http://www.lti.cs.cmu.eduwww.lti.cs.cmu.edu//ResearchResearch/CMT-/CMT-home.htmlhome.html► Osnovan je 1986. godine i čine ga 50ak zaposlenih i Osnovan je 1986. godine i čine ga 50ak zaposlenih i
studentistudenti► Centar za strojno prevođenje Centar za strojno prevođenje CMT istraživački je CMT istraživački je
centar Instituta za jezične tehnologije u Školi za centar Instituta za jezične tehnologije u Školi za računalstvo SCSračunalstvo SCS
► Bavi se naprednim istraživanjem i razvojem tehnologija Bavi se naprednim istraživanjem i razvojem tehnologija za obradu prirodnog jezika, sa fokusom na visoko za obradu prirodnog jezika, sa fokusom na visoko kvalitetno višejezično strojno prevođenjekvalitetno višejezično strojno prevođenje
CENTER FOR MACHINE CENTER FOR MACHINE TRANSLATION (CMT)TRANSLATION (CMT)
Neki od projekata CMTa su:Neki od projekata CMTa su:1.1. DIPLOMATDIPLOMAT/Tongues /Tongues –govor-u-govor (speech-to-–govor-u-govor (speech-to-
speech) prevoditelj, koristi tehnike strojnog speech) prevoditelj, koristi tehnike strojnog prevođenja primarno razvijene za projekt Pangloss. prevođenja primarno razvijene za projekt Pangloss. Prvi testni primjerak: Srpsko-Hrvatski/EngleskiPrvi testni primjerak: Srpsko-Hrvatski/Engleski
2.2. KANTKANT ( (Knowledge-based, Accurate TranslatioKnowledge-based, Accurate Translation) – n) – pokrenut je 1989, koristi kontrolirani vokabular i pokrenut je 1989, koristi kontrolirani vokabular i gramatiku za svaki izvorni jezik i semantičke modele gramatiku za svaki izvorni jezik i semantičke modele za tehničke domene da bi postigli vrlo točan prijevod.za tehničke domene da bi postigli vrlo točan prijevod.
3.3. NESPOLE!NESPOLE! – je govor-u-govor (speech-to-speech) – je govor-u-govor (speech-to-speech) prevoditelj sa namjerom da olakša elektroničku prevoditelj sa namjerom da olakša elektroničku trgovinu preko internetatrgovinu preko interneta
CENTER FOR MACHINE CENTER FOR MACHINE TRANSLATION (CMT)TRANSLATION (CMT)
Predmet Strojno prevođenje pri Institutu za jezične Predmet Strojno prevođenje pri Institutu za jezične tehnologije LTI, a ujedno i istraživači u tehnologije LTI, a ujedno i istraživači u Centru, predaju: Centru, predaju:
1.1. Teruko Mitamura (glavni predavač)Teruko Mitamura (glavni predavač)
2.2. Robert FrederkingRobert Frederking
3.3. Eric NybergEric Nyberg
TERUKO MITAMURATERUKO MITAMURA
► Dr. Teruko Mitamura je Senior Research Scientist na Dr. Teruko Mitamura je Senior Research Scientist na Institutu za jezične tehnologije (LTI)Institutu za jezične tehnologije (LTI)
► Predaje 3 predmeta i to: Predaje 3 predmeta i to: 1.1. Gramatika i leksikoni (Gramatika i leksikoni (Grammars and LexiconsGrammars and Lexicons) pod ) pod
šifrom šifrom 11-72111-7212.2. Strojno prevođenje (Strojno prevođenje (Machine TranslationMachine Translation)) pod šifrom pod šifrom
11-73111-7313.3. Jezične tehnologije u CALL (Jezične tehnologije u CALL (Language Technologies Language Technologies
in CALLin CALL)) pod šifrom pod šifrom 11-71711-717CALL = Computer-Aided Language LearningCALL = Computer-Aided Language Learning
=Učenje jezika uz pomoć računala=Učenje jezika uz pomoć računala
TERUKO MITAMURATERUKO MITAMURA
ProjektiProjekti::►KANTKANT: Knowledge-based Machine Translation : Knowledge-based Machine Translation ►JAVELINJAVELIN: Question Answering System : Question Answering System ►CAMMIA: Dialogue Management System CAMMIA: Dialogue Management System ►CLICK system (Controlled Language Input for CLICK system (Controlled Language Input for
Conceptual Knowledge) Conceptual Knowledge)
ROBERT E. FREDERKINGROBERT E. FREDERKING
► Dr. Robert E. Frederking je Senior Systems Scientist Dr. Robert E. Frederking je Senior Systems Scientist na Institutu za jezične tehnologije (LTI)na Institutu za jezične tehnologije (LTI)
► Predaje 4 predmeta i toPredaje 4 predmeta i to ::1.1. Algoritmi za NLPAlgoritmi za NLP ((Algorithms for NLPAlgorithms for NLP)) pod šifrom pod šifrom
11-71111-711NLP = Natural Language ProcessingNLP = Natural Language Processing
= Obrada prirodnog jezika = Obrada prirodnog jezika2.2. Jezične Tehnologije (Jezične Tehnologije (Language Technologies) Language Technologies) pod pod
šifrom šifrom 11-68211-6823.3. Strojno prevođenje (MT) pod šifrom Strojno prevođenje (MT) pod šifrom 11-73111-731
ROBERT E. FREDERKINGROBERT E. FREDERKING
4.4. Jezične tehnologije za e-Trgovinu (Jezične tehnologije za e-Trgovinu (Language Language Technologies for eCommerceTechnologies for eCommerce) pod šifrom ) pod šifrom tcr865tcr865
ProjektiProjekti::► Translingual Information RetrievalTranslingual Information Retrieval – višejezično – višejezično
pretraživanje informacijapretraživanje informacija► DIPLOMAT DIPLOMAT – o njemu smo već nešto rekli– o njemu smo već nešto rekli► Pangloss Pangloss - tehnike strojnog prevođenja razvijene za - tehnike strojnog prevođenja razvijene za
taj projekt koriste se u DIPLOMATu taj projekt koriste se u DIPLOMATu ► NESPOLE!NESPOLE! – o njemu smo isto već rekli – o njemu smo isto već rekli
ERIC NYBERGERIC NYBERG
http://www-2.cs.cmu.edu/~ehn/http://www-2.cs.cmu.edu/~ehn/
ERIC NYBERGERIC NYBERG
► Dr. Eric Nyberg jeDr. Eric Nyberg je Associate Professor Associate Professor nana Školi za Školi za računalstvo računalstvo (SCS) (SCS) ii na na Heinz School of Public Policy Heinz School of Public Policy and Management (Heinz). and Management (Heinz). Poučava i na novom institutu Poučava i na novom institutu za e-Trgovinu (za e-Trgovinu (eCommerce InstituteeCommerce Institute), kojeg su ), kojeg su formirali formirali SCS SCS ii GSIA (eCom) GSIA (eCom)
► Predaje Predaje ► Software Engineering for ITSoftware Engineering for IT I I► Software Engineering for IT IISoftware Engineering for IT II, pod šifrom , pod šifrom 11-79211-792► eCommerce Systems DesigneCommerce Systems Design, pod šifrom, pod šifrom 20-783 20-783
MACHINE TRANSLATIONMACHINE TRANSLATION
► Strojno prevođenje je predmet koji pruža uvod u Strojno prevođenje je predmet koji pruža uvod u povijest, tehnike i istraživačke teme strojnog povijest, tehnike i istraživačke teme strojnog prevođenja.prevođenja.
Ciljevi:Ciljevi:► Upoznati se sa osnovama MT i sličnih sustava Upoznati se sa osnovama MT i sličnih sustava ► Naučiti o teoriji i pristupima u strojnom prevođenjuNaučiti o teoriji i pristupima u strojnom prevođenju ► Naučiti osnovne tehnike za razvoj strojnog prevođenjaNaučiti osnovne tehnike za razvoj strojnog prevođenja ► Bolje obraditi jedno od područja strojnog prevođenjaBolje obraditi jedno od područja strojnog prevođenja iliili
izvršiti analizu danog problema, koristeći se izvršiti analizu danog problema, koristeći se najprikladnijim tehnikama (uključuje istraživanje, najprikladnijim tehnikama (uključuje istraživanje, izvještaj i prezentaciju)izvještaj i prezentaciju)
MACHINE TRANSLATIONMACHINE TRANSLATION
Sadržaj:Sadržaj:►Uvod u strojno prevođenjeUvod u strojno prevođenje►Povijest strojnog prevođenjaPovijest strojnog prevođenja►Moderna teorija i pristupi MTuModerna teorija i pristupi MTu
Metode transfera (Metode transfera (Transfer MethodsTransfer Methods)) Interlingua MT Interlingua MT Example-based MT Example-based MT Statistički Statistički MT MT Multi-Engine MT Multi-Engine MT
MACHINE TRANSLATIONMACHINE TRANSLATION
► Razvoj MT sustavaRazvoj MT sustava Analiza područja i sistemske specifikacije (Analiza područja i sistemske specifikacije (Domain Analysis Domain Analysis
and System Spec.and System Spec.)) Analyzer SW Development Analyzer SW Development Generator SW Development Generator SW Development Linguistic Knowledge Development Linguistic Knowledge Development
► Ostale temeOstale teme Ambiguity & Ambiguity Resolution Ambiguity & Ambiguity Resolution Kontrolirani jezici ulaz/izlaz (Kontrolirani jezici ulaz/izlaz (Controlled Language Controlled Language
Input/OutputInput/Output))
MACHINE TRANSLATIONMACHINE TRANSLATION
Govor-u-govor prevođenje (Govor-u-govor prevođenje (Speech-to-Speech Speech-to-Speech TranslationTranslation))
MT Workflow and Human Factors MT Workflow and Human Factors Evaluacija MTaEvaluacija MTa Što je korisni MT sustavŠto je korisni MT sustav? ? Komercijalni MT sustaviKomercijalni MT sustavi Budućnost Strojnog prevođenja Budućnost Strojnog prevođenja Future of MT Future of MT
►Prezentacija zadanog projekta i razgovorPrezentacija zadanog projekta i razgovor
MACHINE TRANSLATIONMACHINE TRANSLATION
Literatura:Literatura:
1.1. W. John Hutchins and Harold L. Somers, "An W. John Hutchins and Harold L. Somers, "An Introduction to Machine Translation",Introduction to Machine Translation",Academic Press, San Diego, 1992.Academic Press, San Diego, 1992.
2.2. Arturo Trujillo, "Translation Engines: Arturo Trujillo, "Translation Engines: Techniques for Machine Translation"Techniques for Machine Translation"Springer-Verlag Series on Applied Computing, Springer-Verlag Series on Applied Computing, 1999.1999.