Glossar-Eintrag
mammoth.js
JavaScript-Bibliothek, die DOCX-Dokumente in sauberes, semantisches HTML umwandelt, als Zwischenschritt zur PDF-Erzeugung.
mammoth.js ist eine quelloffene JavaScript-Bibliothek, die Word-Dokumente im DOCX-Format in HTML übersetzt. Ihr Ziel ist nicht die pixelgenaue Nachbildung des Word-Layouts, sondern die saubere Übernahme der inhaltlichen Struktur: Überschriften, Absätze, Listen, Fett- und Kursivschrift sowie Tabellen.
Mammoth liest das DOCX als ZIP-Archiv, wertet das enthaltene document.xml aus und ordnet die Word-Formatvorlagen passenden HTML-Elementen zu. Eine Überschrift im Stil "Heading 1" wird so zu einem h1-Element. Das Ergebnis ist semantisch sauberes HTML statt verschachtelter Layout-Tabellen.
In einem Word-zu-PDF-Konverter bildet mammoth.js den ersten Schritt: Es erzeugt das HTML, das anschließend von jsPDF in ein PDF gerendert wird. Da mammoth bewusst auf inhaltliche Struktur statt visuelle Pixeltreue setzt, können sehr komplexe Word-Layouts im PDF vereinfacht erscheinen.
Verwandte Begriffe
jsPDF
JavaScript-Bibliothek zur Erzeugung von PDF-Dateien direkt im Browser, ohne Server-Komponente.
DOCX
Standard-Dateiformat von Microsoft Word seit 2007, ein ZIP-Container mit XML-Dateien nach dem OOXML-Standard.
Rendering
Der Prozess, bei dem strukturierte Inhalte in eine sichtbare, fertig gesetzte Seitendarstellung umgewandelt werden.