word-pdf.de

Glossar-Eintrag

mammoth.js

JavaScript-Bibliothek, die DOCX-Dokumente in sauberes, semantisches HTML umwandelt, als Zwischenschritt zur PDF-Erzeugung.

mammoth.js ist eine quelloffene JavaScript-Bibliothek, die Word-Dokumente im DOCX-Format in HTML übersetzt. Ihr Ziel ist nicht die pixelgenaue Nachbildung des Word-Layouts, sondern die saubere Übernahme der inhaltlichen Struktur: Überschriften, Absätze, Listen, Fett- und Kursivschrift sowie Tabellen.

Mammoth liest das DOCX als ZIP-Archiv, wertet das enthaltene document.xml aus und ordnet die Word-Formatvorlagen passenden HTML-Elementen zu. Eine Überschrift im Stil "Heading 1" wird so zu einem h1-Element. Das Ergebnis ist semantisch sauberes HTML statt verschachtelter Layout-Tabellen.

In einem Word-zu-PDF-Konverter bildet mammoth.js den ersten Schritt: Es erzeugt das HTML, das anschließend von jsPDF in ein PDF gerendert wird. Da mammoth bewusst auf inhaltliche Struktur statt visuelle Pixeltreue setzt, können sehr komplexe Word-Layouts im PDF vereinfacht erscheinen.

Verwandte Begriffe

Anzeige
Anzeige
Anzeige
Anzeige
Anzeige