Ausgabe_LW_2015-05
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Defekte Dokumente<br />
RETTEN & REPARIEREN SPECIAL<br />
Gnumeric: Die alternative Tabellenkalkulation<br />
öffnet die Formate ODS,<br />
XLS und XLS und lässt sich auch<br />
nicht beeindrucken, wenn Bytes am<br />
Ende der Datei fehlen. Bei beschädigtem<br />
Header liefert Gnumeric keine<br />
besseren Ergebnisse als Libre Office<br />
Calc. Das Paket Gnumeric ist über die<br />
Paketmanager aller großen Distributionen<br />
verfügbar.<br />
WPS Office: Das Büropaket der chinesischen<br />
Software-Firma Kingsoft<br />
gibt es in einer kostenlosen Version für<br />
Linux. WPS Office, früher als Kingsoft<br />
Office bekannt, versteht sich gut auf<br />
die Microsoft-Formate DOC, DOCX,<br />
XLS, XLSX, PPT und PPTX. Zur Installation<br />
stehen unter http://wpscommunity.org/download.html<br />
DEBund<br />
RPM-Pakete bereit, die das<br />
Büropaket unter Debian, Ubuntu<br />
(DEB) sowie Open Suse und Fedora<br />
(RPM) installieren.<br />
Manuelle Rettung: Als ZIP-Archiv<br />
entpacken<br />
Das Open-Document-Format von Libre<br />
Office (ODT, ODS, ODP) und<br />
Open Office sowie das Format OOX-<br />
ML von Microsoft (DOCX, XSLX,<br />
PPTX) bestehen aus einem ZIP-Archiv.<br />
Das Archiv enthält mehrere einzelne<br />
Dateien für Struktur, Objekte wie Bilder<br />
und speichert den Textinhalt in einer<br />
XML-Datei ab. Schwer angeschlagene<br />
Dokumente können Sie zunächst<br />
mit dem Kommandozeilenprogramm<br />
zip wie eine beschädigte ZIP-Datei behandeln<br />
und mittels der eingebauten<br />
Reparaturfunktion in eine neue Datei<br />
mit restauriertem Header schreiben.<br />
Um eine Datei von Libre Office Writer<br />
mit dem Namen „dokument.ods“ so<br />
zu behandeln, geben Sie in einem Terminal<br />
den Befehl<br />
zip -F dokument.ods --out repa<br />
riert.ods<br />
ein. Versuchen Sie dann abermals, die<br />
so erzeugte Datei „repariert.ods“ mit<br />
Libre Office zu öffnen.<br />
Falls das immer noch nicht gelingt,<br />
dann gibt es noch einen Reparaturparameter<br />
mit einer sehr losen Interpretation<br />
des ZIP-Formats:<br />
Reagiert sehr empfindlich: Die automatische Reparaturfunktion von Libre Office 4.x erkennt<br />
zwar, wenn eine Datei nicht Ordnung ist, steigt aber schon bei kleinen Fehlern im Datei-<br />
Header aus.<br />
Fehlertolerantes Abiword: Wenn es um die Dateiformate von Libre Office Writer und Microsoft<br />
Word geht, dann bietet Abiword bessere Chancen als Libre Office, beschädigte Dateien<br />
zu öffnen und wenigstens das Wichtigste zu retten.<br />
zip -FF dokument.ods --out repa<br />
riert.ods<br />
Sollte sich der Datei-Header mit diesem<br />
zweiten Befehl reparieren lassen,<br />
dann können Sie anschließend wenigstens<br />
einige Dateien extrahieren. Hilfreich<br />
ist das bei Dokumenten von Libre<br />
Office Writer (ODT) und Microsoft<br />
Word (DOCX), denn Sie können so<br />
zumindest noch Teile des Texts manuell<br />
retten. Entpacken Sie dazu die zuvor<br />
restaurierte Datei mit dem folgenden<br />
Kommando<br />
unzip repariert.ods<br />
Den Textinhalt finden Sie dann bei<br />
DOCX-Dateien in der Datei „Document.xml“<br />
im Verzeichnis „Word“.<br />
Bei ODT-Dateien liegt der Text als<br />
„content.xml“ vor. Es handelt sich in<br />
beiden Fällen um Dateien in einer<br />
XML-Struktur mit zahlreichen Tags.<br />
Für die Ansicht des eigentlichen Inhalts<br />
können Sie die XML-Tags mit<br />
Hilfe eines Browsers ausblenden: Benennen<br />
Sie die Dateiendung von<br />
„.xml“ nach „.html“ um, und öffnen<br />
Sie die Datei mit Firefox oder Chrome/<br />
Chromium. Der Browser präsentiert<br />
nun den puren Textinhalt ohne Struktur<br />
und Formatierungen, den Sie jetzt<br />
in ein neues Dokument kopieren und<br />
einfügen können.<br />
Korrekte Sonderzeichen erhalten Sie,<br />
wenn Sie die Zeichencodierung zu<br />
„Unicode“ umstellen, was in Firefox<br />
über das Menü „Ansicht -> Zeichenkodierung<br />
-> Unicode“ gelingt und in<br />
Chrome/Chromium über das Menüsymbol<br />
mit „Weitere Tools -> Codierung<br />
-> Unicode (UTF-8)“.<br />
●<br />
LinuxWelt 5/<strong>2015</strong><br />
37