Einführung in die Maschinelle Übersetzung - WebHome · Walther v.Hahn Universität ... nach Kundenauskunft ca. 75% • Dienstverbesserung durch MAT-Systeme (nach deutsche Airbus):
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
A. Grundsätzlich komplexe Eigenschaften natürlicher Sprachengegenüber formalen Sprachen müssen auf allen Ebenen (Wort,Syntax, Text, Kommunikation) behandelt werden.
B. Unterschiede zwischen den Sprachen müssen aufeinander abgebildetwerden.1. Lexikalische Wahl2. Syntaktische Struktur3. Begriffliches System4. Stilistische Regeln5. Kultureller Hintergrund
• Sprachsignal-Ambiguität ”Rat” vs. “Rad” “peak” vs. “peek”• lexikalische Ambiguität “Fahren sie zu der nächsten Bank!”• Syntaktische Ambiguität “I saw the Dacia-Service driving to the airport”• Pragmatische Ambiguität “Können Sie mir bitte die Anweisungen per SMS
schicken?” (Als Antwort nicht: “Ja, kann ich!”)• Referentielle Ambiguität “Nehmen Sie das Warndreieck aus dem Auto und
stellen Sie es sichtbar auf die Strasse• Ambiguität ist der Hauptunterschied zwischen formalen und natürlichen
• Nichtkontinuerliche Komponenten (Der Kraftstoff, den Sie getankt haben,weicht wahrscheinlich von der Norm ab.)• Ellipsen (“Hier ebenso”)• Paraphrasen (“geht in Ordnung!” “ok!”)• Kohärenz “Es ist auch durchgebrannt”• Verstehen durch WeltwissenBei Fahrten in England oder ähnlichen Ländern blendet das asymmetrischeAbblendlicht den Gegenverkehr.
A2. Weitere Merkmale natürlicher Sprachen
• Fernbeziehung von KonstituentenEine bei allen Bedingungen einwandfrei arbeitende Abgasreinigungsanlage
Stellen Sie sich diesePhänomene einmal beiProgrammier-sprachen vor ...
B1. Unterschiede zwischen Sprachen:Lexikalische Wahl - 1 -
• Ein Wort in der Quellsprache muss durch mehrere einzelne Wörter oderMehrwortausdrücke in der Zielsprache übersetzt werden (dt. Senkkopfschraube engl. counter sunk bolt),
• Eins-zu-mehr Übersetzungen (Ein Wort in der Quellsprache hatkontextabhängig mehrere Übersetzungen)– QS: Wall (engl.) wird mit ZS Mauer (dt.) oder Wand (dt.) übersetzt,
abhängig davon, ob das Objekt innen oder aussen ist. In diesem Fall müssensemantische Merkmale verglichen werden müssen.
– Für die Übersetzung von “know” muss der grammatische Kontext bekanntsein:
I know him (engl.) → Ich kenne ihn (dt.)I know a solution (engl.) → Ich weiß eine Lösung (dt.)
• 50% der Übersetzungsfehler in der MÜ sind lexikalische Fehler
B1. Unterschiede zwischen Sprachen:Lexikalische Wahl - 3 -
Lexikalische Lücken - Einzelwörter/Konzepte in eine Sprache, die in derZielsprache nur umschrieben werden können, Z.B. abschleppen (dt.) =to take in tow (engl.)
Solche Probleme können nicht allein durch lexikalischen Transfer gelöstwerden, da es z.B. im Englischen Lexikon keinen Eintrag “to take intow” geben kann.
Lexical gaps betreffen nicht nur spezifische kulturelle Konzepte (e.g.HartzIV, Meldebescheinigung), letztere sind normalerweise aucheinfacher, da sie normalerweise unübersetzt bleiben.
• Höflichkeitsformeln sind extrem unterschiedlich z.B. zwischenAmerikanisch und Japanisch:
• Am. Engl.: „Hi, John, I am from the ‚Efficiency‘ group and I want toinform you, that ...“
• Jap.: „Verehrter Herr Watanabe, Ich bin sicher, dass ich Ihrewertvolle Zeit wegen einer Kleinigkeit in Anspruch nehme und sie vielewichtige Arbeiten zu tun haben. Könnten Sie mir bitte sagen, wann Sieeinige Minuten Zeit haben, um mit mir zu sprechen. ...“
• Männer und Frauen benutzen im Japanischen in Anhängigkeit vomGeschlecht und Rang des/r Angesprochenen unterschiedliche Sprache,bis in die Morphologie hinein
• In den Quelltexten werden bekannte schwierige Bearbeitungsprobleme gesucht undwenn möglich ersetzt.
• Beispiele für solche Operationen:– Identifizierung von Eigennamen (“von Hahn”)– Markierung von grammatischen Kategorien von Homographen (“run”)– Markierung von eingebettete Äusserungen (“Er sagte: ’Ich gehe!’”)– Markierung von koordinierten Stukturen (“und, oder ...”)– Erstetzung von unbekannten Wörtern (“Landesvergabeverordnung”)– Extreme Form: Neuformulierung in einer kontrollierten Sprache
• Korrektur der Ausgabe nach einem vorher vereinbarten Standard (z.B.Firmensprache).– Minimal bei Übersetzung für Assimilation,– Sehr stark für Dissemination
• Häufige Operationen:– Ersetzung von Wörtern durch geeignete “Synonyme”,– Ersetzung von einzelnen Wörtern durch Idiome,– Syntaxkorrektur.
• Im Gegensatz zu anderen Softwarewerkzeugen gibt es beiÜbersetzungen keine eindeutige Zielstruktur, keine “Musterlösung”,mit der die Lösung verglichen werden kann:
• Für eine Eingabe gibt es mehrere korrekte Übersetzungen• Die Evaluation eines MT-Systems ist von den Aufgaben des Systems