This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
sieht "so ungefähr" aus wie HTMLgleiche Basis (Standard Generalized Markup Language, SGML)proven success (SGML und HTML sind Erfolge)geringere Hemmschwelle für Umsteiger
funktioniert ähnlich wie HTMLgleiche Strukturierungsverfahren (Grammatiken)rein textorientiertes Format (keine Binärdaten!)
andere Zielgruppe als HTMLweiterverarbeitbare Information (B2B)anwendungsabhängige Datenstrukturenetabliertes Umfeld (EDIFACT, SGML, proprietär)
3.7.03 Erik Wilde 4
SGML
Standard Generalized Markup Languagedefiniert in ISO Standard 8879 (1986)
Markup Language trennt Struktur und TextStruktur ist syntaktisch identifizierbar
Vorteile einer Markup Languageeinfache Repräsentation (Erzeugung "von Hand")Austauschbarkeit als rein textbasierte Dokumente
GML als erstes inhaltsorientiertes FormatDokumentformatierung als getrennter SchrittDefinition von Dokumentenklassen (Datentypen)
SGML kombiniert Struktur und Textzeichenbasiertes Format (keine binäre Form)Strukturinformation in der Form von "Markup"
internationaler Standard (ISO 8879, 1986)nicht unter Kontrolle eines Herstellersunabhängig von spezifischer Software
Optimierungen für manuelle Eingabegedacht als Erleichterungen für Menschenaber Hindernisse und Anforderungen für Maschinen
3.7.03 Erik Wilde 6
Aufbau von SGML
die SGML Declarationkonkrete Syntax (Zeichen mit spezieller Bedeutung)SGML Features (wie Markup Minimization)
die Document Type Definition (DTD)definiert erlaubte Elementedefiniert Kombination der erlaubten Elementedefiniert Attribute der erlaubten Elementedefiniert Entities, z.B. für Sonderzeichen
das Document selberStruktur des Inhaltes gemäss der DTDInhalt der Struktur (Text)
Elemente sind der grundlegende MechanismusStrukturierung von hierarchischen Daten"beliebige" Namensgebung für ElementeDefinition gemäss inhaltlichen StrukturenKernpunkt des DTD-Designs
Elementtypen haben zwei wichtige Aspekteein content model für erlaubten InhaltAttribute (optionales Vorkommen oder notwendig)
DTD deklariert Typ, den Dokument verwendet
DTD: <!ELEMENT titel (#PCDATA) >
Dokument: <titel>XML - Grundlagen und Umfeld</titel>
3.7.03 Erik Wilde 16
Elementtyp-Deklarationen
der Inhalt von Elementen kann seinnur Elemente (element content model)Text gemischt mit Elementen (mixed content model)kein Inhalt erlaubt (EMPTY Keyword)
das content model eines Elementsoptionales Vorkommen mit ?, wiederholbar mit *notwendig und wiederholbar mit +Sequenz mit ,Alternativen (Exklusiv-oder) mit |
nicht erlaubt sind folgende SGML Konstruktevertauschbare Vorkommen mit & und Exceptions
HTML basiert auf SGMLGross-/Kleinschreibung ist irrelevantMarkup-Minimierung ist erlaubt (Tags weglassen)
99% aller HTML-Seiten sind fehlerhaftTools und Menschen sind nachlässigBrowser und Suchmaschinen sind tolerantdiese beiden Faktoren verstärken sich gegenseitig
XHTML ist HTML auf XML-Basiseine XHTML-Seite muss gültiges XML seindamit mit XML-Tools weiterverarbeitbareinfach mit XML-Tools zu erzeugen
Umwandlung bestehender HTML-Seiten1. valides HTML (http://validator.w3.org)2. alle Elemente und Attribute in lowercase3. leere Elemente als <element /> codieren4. End-Tags einfügen (<p>Text</p>)5. Attributwerte müssen in Quotes sein6. Attributnamen müssen angegeben werden7. vordefinierte Attributwerte müssen lowercase sein
http://www.w3.org/TR/xhtml1/#diffs
es existieren Utilities zur Umformunghttp://tidy.sourceforge.net
MathML 2.0 ist eine grosse DTDca. 30 Elemente für Presentation Markupca. 140 Elemente für Content Markup
Arithmetic, Algebra, and Logic (<plus/>)Relations (<eq/>)Calculus (<int/>)Theory of Sets (<union/>)Sequences and Series (<sum/>)Classical Functions (<sin/>)Statistics (<mean/>)Linear Algebra (<matrix/>)Constants (<pi/>)