Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg „Interdisziplinäre Zusammenarbeit in der Medieninformatik“ Kolloquium zu Ehren von Prof. Dr.-Ing. Detlef Klöditz Köthen, 22. November 2001
49
Embed
Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre.
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Entwicklung und Einsatz vonLokalisierungswerkzeugen
<meta name="generator" content="HTML Tidy, see www.w3.org" />
<meta http-equiv="Content-Type"
content="text/html; charset=utf-8" />
<title>Fachübersetzen</title>
</head>
...
Web-TCM
Workfloweinsprachig → mehrsprachig
1. HTML-Dateien bereitstellen– HTML Tidy (www.w3w.org)
2. HTML-Dateien in XHTML-Dateien konvertieren– Jede Datei beginnt mit einer DTD– Jedes Tag muss beendet werden, z.B. <br></br>, kurz: <br />– Alle HTML-Bestandteile werden klein geschrieben.– Substitution bestimmter Tags, z.B. <b> <strong>
3. Segmentierung der HTML-Dateien– *.htm (XHTML)– XML-Parser in Smalltalk (Parse-Tree)– Segmentierer in Smalltalk (Baumtransformation, TM-
Segmente)– Generierung der ssp-Dateien (*.ssp)– Ablegen der AS-Segmente (hier: deutsch) in das TM
Web-TCM
SSPSmalltalk Server Pages
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
1. HTML-Dateien bereitstellen– HTML Tidy (www.w3w.org)
2. HTML-Dateien in XHTML-Dateien konvertieren– Jede Datei beginnt mit einer DTD– Jedes Tag muss beendet werden, z.B. <br></br>, kurz: <br />– Alle HTML-Bestandteile werden klein geschrieben.– Substitution bestimmter Tags, z.B. <b> <strong>
3. Segmentierung der HTML-Dateien– *.htm (XHTML)– XML-Parser in Smalltalk (Parse-Tree)– Segmentierer in Smalltalk (Baumtransformation, TM-
Segmente)– Generierung der ssp-Dateien (*.ssp)– Ablegen der AS-Segmente (hier: deutsch) in das TM
4. ResegmentierenWeb-TCM
Workfloweinsprachig → mehrsprachig
1. HTML-Dateien bereitstellen– HTML Tidy (www.w3w.org)
2. HTML-Dateien in XHTML-Dateien konvertieren– Jede Datei beginnt mit einer DTD– Jedes Tag muss beendet werden, z.B. <br></br>, kurz: </br>– Alle HTML-Bestandteile werden klein geschrieben.– Substitution bestimmter Tags, z.B. <b> <strong>
3. Segmentierung der HTML-Dateien– *.htm (XHTML)– XML-Parser in Smalltalk (Parse-Tree)– Segmentierer in Smalltalk (Baumtransformation, TM-Segmente)– Generierung der ssp-Dateien (*.ssp)– Ablegen der AS-Segmente (hier: deutsch) in das TM
4. Resegmentieren5. Übersetzen
– Translation Memory in allen Zielsprachen
Web-TCM
Export in kommerzielle TM-SystemeTMX-Austauschformat
<?xml version="1.0"?>
<!DOCTYPE tmx PUBLIC "-//LISA OSCAR:1997//DTD for Translation Memory eXchange//EN" "http://www.lisa.org/tmx/tmx11.dtd">
<tmx version="1.1">
<header
creationtool="Web-TCM"
creationtoolversion="0.55"
datatype="HTML"
o-tmf="Web-TCM"
segtype="sentence"
adminlang="en-us"
srclang="DE"
o-encoding="utf-8">
</header>
<?xml version="1.0"?>
<!DOCTYPE tmx PUBLIC "-//LISA OSCAR:1997//DTD for Translation Memory eXchange//EN" "http://www.lisa.org/tmx/tmx11.dtd">
<tmx version="1.1">
<header
creationtool="Web-TCM"
creationtoolversion="0.55"
datatype="HTML"
o-tmf="Web-TCM"
segtype="sentence"
adminlang="en-us"
srclang="DE"
o-encoding="utf-8">
</header>
<body><tu tuid="1"><tuv lang="de"><seg>Sprach- und Sachfachangebot</seg></tuv><tuv lang="en"><seg>Languages and application domains</seg></tuv><tuv lang="fr"><seg>Langues et disciplines spécialisées</seg></tuv><tuv lang="ru"><seg>Языка и дисциплина</seg></tuv></tu>... </body>
<body><tu tuid="1"><tuv lang="de"><seg>Sprach- und Sachfachangebot</seg></tuv><tuv lang="en"><seg>Languages and application domains</seg></tuv><tuv lang="fr"><seg>Langues et disciplines spécialisées</seg></tuv><tuv lang="ru"><seg>Языка и дисциплина</seg></tuv></tu>... </body>
Entwicklungsaufwand
• Zwei Arbeitswochen• Interaktive Weiterentwicklung während der
Nutzung
• Zwei Arbeitswochen• Interaktive Weiterentwicklung während der
Nutzung
Web-TCM
ROBUSTROBUST
Web-TCMVergleich mit kommerziellen TM-basierten
Lokalisierungswerkzeugen
• Erstes Lokalisierungswerkzeug, das virtuelle Team-Arbeit real unterstütztBei verfügbaren kommerziellen Systemen müssen TMs importiert bzw. exportiert werden und erfordern immer einen Abgleich der TMs verschiedener Übersetzer
• Passwort-geschützter Zugang• https (http mit Verschlüsselung)• Kombiniert Translation-Memory-Technologie mit Content-
Management• Unterstützt Export in kommerzielle TM-Systeme
(TMX-Austauschformat)• Unterstützt Export statischer Web-Seiten in allen
verfügbaren Sprachen
• Erstes Lokalisierungswerkzeug, das virtuelle Team-Arbeit real unterstütztBei verfügbaren kommerziellen Systemen müssen TMs importiert bzw. exportiert werden und erfordern immer einen Abgleich der TMs verschiedener Übersetzer
• Passwort-geschützter Zugang• https (http mit Verschlüsselung)• Kombiniert Translation-Memory-Technologie mit Content-
Management• Unterstützt Export in kommerzielle TM-Systeme
(TMX-Austauschformat)• Unterstützt Export statischer Web-Seiten in allen
verfügbaren Sprachen
Kompetenz für das Lokalisierungsprojektund den Einsatz von Web-TCM
Sprachdatenverarbeitung„Grundlagen der Lokalisierungstechnologie“
• Codierungssysteme• Lokalisierung von Schulungsmaterial (Text und Grafik) mit TM• Dynamische Web-Seiten, HTML, XML• Lokalisierungsprojekt: Web-Site-Lokalisierung (D E, F, R)
– Arbeitsschritte• Extraktion von Textelementen aus Grafiken• Vorbereitung der Terminologie• Übersetzung der Webseiten• „Proofreading“• Übergabe
• Lokalisierungswerkzeug (Web-TCM)
• Codierungssysteme• Lokalisierung von Schulungsmaterial (Text und Grafik) mit TM• Dynamische Web-Seiten, HTML, XML• Lokalisierungsprojekt: Web-Site-Lokalisierung (D E, F, R)
– Arbeitsschritte• Extraktion von Textelementen aus Grafiken• Vorbereitung der Terminologie• Übersetzung der Webseiten• „Proofreading“• Übergabe
• Lokalisierungswerkzeug (Web-TCM) SS 2001
Entwicklung und Einsatz vonLokalisierungswerkzeugen
1. Lokalisierung
2. Kompetenzen bei der Entwicklung von Softwareund Lokalisierungswerkzeugen
3. Kompetenzen beim Einsatz von Lokalisierungswerkzeugen
4. Entwicklung des LokalisierungswerkzeugsWeb-TCM
5. Resümee
1. Lokalisierung
2. Kompetenzen bei der Entwicklung von Softwareund Lokalisierungswerkzeugen
3. Kompetenzen beim Einsatz von Lokalisierungswerkzeugen
4. Entwicklung des LokalisierungswerkzeugsWeb-TCM
5. Resümee
Resümee
• Sowohl Entwicklung als auch Einsatz von Lokalisierungswerkzeugen erfordern Kompetenzen aus den drei Bereichen:– Informatik– Computerlinguistik– Sprachmittlung, Fachsprachen
• Einrichtung der Vertiefungsrichtung „Softwarelokalisierung“ im Diplomstudiengang Fachübersetzen am Fachbereich Informatik trägt dieser Interdisziplinarität Rechnung
• FB Informatik der HS Anhalt (FH) damit in der Hochschulausbildung wegweisend
• Sowohl Entwicklung als auch Einsatz von Lokalisierungswerkzeugen erfordern Kompetenzen aus den drei Bereichen:– Informatik– Computerlinguistik– Sprachmittlung, Fachsprachen
• Einrichtung der Vertiefungsrichtung „Softwarelokalisierung“ im Diplomstudiengang Fachübersetzen am Fachbereich Informatik trägt dieser Interdisziplinarität Rechnung
• FB Informatik der HS Anhalt (FH) damit in der Hochschulausbildung wegweisend