Hallo,
seit einer Woche versuche ich die Möglichkeiten auszuschöpfen, die mir bisher verfügbare Tools bieten, irgendwie in Richtung von Word-Dokumenten zu kommen von tex-Quellen aus.
Ausgelöst hat diese Odyssee eine Nutzung von Word in meinem Forschungsinstitut bzw. meiner Arbeitsgruppe. Ich muss gewährleisten, dass mein Vorgesetzter und andere nicht-LaTeX-Kundige meine Dokumente überarbeiten können - auch Formeln!!!!
Bisher war ich nicht sehr erfolgreich und habe als Resultate bisher nur mit pdftotext aus XPdf und dem darauf basierenden pdftohtml eine vergleichbare Formatierung hinbekommen. Bei Ersterem stimmt die Positionierung des Textes bei Letzterem auf die Schrift (boldface etc.). Ersteres lässt sich problemlos in Word öffnen und Letzteres nur mit wiederum schlechterer Formatierung wie zuvor. (Alles was nicht Text ist wird in pdftohtml als Bild im Hintergrund ausgelagert. Das mag Word nicht und auch ein in den Hintergrund verrücktes Bild hilft nur bedingt weiter.)
Auch der Adobe Acrobat und die Option des "Speichern Unter" als RTF- oder Word-Datei ist nicht viel besser (eher sogar schlechter). Zwar stimmen die Schriftattribute aber die Formatierung des Textes ist miserabel. Zeilenwechsel werden in einem Beispielbrief der scrlttr2-Klasse nicht erkannt. Trennungszeichen werden als Bindestriche mitgeschleppt. Raggedright-Umgebung funktioniert gar nicht. Das gilt natürlich sowohl für rtf als auch doc als Speicherfunktion.
Vor kommerziellen Programmen war ich zunächst zurückgeschreckt. Habe aber nun eine Trialversion von Mathtype und Tex2Word installiert, um mal zu sehen wie da die Lage ist. Und: es sieht für Standard-Dokumente (ein paar Formeln, ein paar Textpassagen etc.) ganz gut aus. Aber alle Komaklassen funktionieren natürlich nicht. Intern gibt es sogenannte PseudoTeX-Files, die einige Klassen enthalten und abdecken. Nur keine Komaklassen!
Hat jemand dazu mehr Erfahrungen gesammelt? Auch tex4ht habe ich installiert und lauffähig bekommen. Auch hierbei hat sich keine Lösung abgezeichnet (Wieder das Word-Öffnen-Problem (aber auch Formatierungsunterschiede!).
Und kennt jemand Word2Tex als Rückkonvertierungsmöglichkeit? Sehen Formeln dann nicht sehr viel schlimmer aus, was die Syntax angeht?
Einige weitere Anmerkungen: Wie sieht es mit anderen latex2html-Konvertern wie Hacha/Hevea aus? Ich habe auch das Tutorial von Philip A. Viton zu SWP (Scientific Word Processing) with tex4ht noch nicht gelesen (dort wird auch Hevea und Hacha erwähnt). Könnte da noch etwas nützliches enthalten sein, dass man brauchbare HTML-Dokumente bekommt, die dann weiterverarbeitet werden können?
Vielleicht über RTF?
Hallo,
vor einiger Zeit musste ich mal Word-Dokumente nach LaTeX konvertieren. Einen Königsweg konnte ich nicht entdecken, die besten Ergebnisse erzielte ich jedoch mit rtf2tex, bzw. rtf2latex. D.h., zuerst mussten die DOCs als RTFs gespeichert werden, dann konnte der Konverter darauf losgelassen werden. Beide Konverter gibt es auch andersherum, tex2rtf, bzw. latex2rtf (gibt es beide über den CTAN). Vielleicht kannst Du damit zufriedenstellendere Ergebnisse erzielen. Ich fürchte aber, dass letzlich keine perfekte Umwandlung egal in welche Richtung möglich sein wird: TeX und Word funktionieren einfach zu unterschiedlich. Für Formeln könnte trotzdem ein Programm wie der MathType-Formeleditor nützlich sein. Er ist funktioniert ähnlich wie der Word-eigene Formeleditor. ist aber leistungsstärker und hat eine LaTeX-Exportfunktion. Leider ist er kostenpflichtig (ca. 50 EUR). Wahrscheinlich ist es langfristig gesehen ergiebiger, wenn Du Deinen Kollegen einfach LaTeX beibringst!
Grüße,
Lucky
Lyx?
Kennst Du Lyx? Wenn Du es schaffst, Deine Text in Lyx zu importieren, dann kannst Du ihn von dort als html exportieren.
Nach meiner Erfahrung funktioniert Lyx unter Linux deutlich besser.
Im übrigen: Auch an mich wird öfter der Wunsch herangetragen, ich möge doch meine Dateien als doc zur Verfügung stellen. Ich verweise stets darauf, dass i c h für den Text verantwortlich bin und daher nur ich ihn ändere. Alle Vorschläge für Änderungen sind willkommen, am besten per e-mail. Ich versende neue Versionen dann jeweils als pdf. (Ich muss aber zugeben, als Selbständiger keine Vorgesetzen zu haben.)
Der Mehrwert von tex wird selbst groben Ignoranten deutlich, wenn man mit \marginpar{\attachfile[description=wichtiger Text]{Wichtiges-Dokument.pdf}} die wichtigsten Dokumente ins pdf einbettet. Ein Klick, und man sieht, wovon der Autor spricht.
Naja, viel Glück,
Alexander
1:1 nach Word kann nicht gehen
Da Word diverse Features wie beispielsweise den Absatzumbruch gar nicht bietet, kann eine Word-Datei nie Formatierungsidentisch mit dem Ergebnis eines LaTeX-Laufs sein. Dazu müsste man schon die DVI-Datei pixelgenau in eine DOC-Datei umwandeln. Man müsste dazu jedes einzelne Zeichen in einen pixelgenau positionierten Textrahmen setzen. Das Ergebnis sähe dann aus wie die DVI-Datei, wäre aber nicht wirklich weiterverarbeitbar.
Das einzige Mal, dass ich eine LaTeX-Datei in eine DOC-Datei umgewandelt habe, habe ich mit tex4ht in ein OpenOffice-Dokument umgewandelt, das als Word97-Datei gespeichert und dann mit Word geladen. Ein paar Nacharbeiten waren allerdings notwendig.
So richtig sinnvoll ist das Vorgehen auch nicht wirklich. Wozu sich die Mühe machen, ein Dokument ordentlich zu setzen, wenn es dann doch als mäßige DOC-Datei weitergereicht wird? Wer das Dokument direkt weiterverarbeiten will, soll LaTeX lernen. Der Aufwand ist weit geringer, als man oft annimmt. Wer nur bestimmte Textpassagen braucht, der kann die aus dem PDF herauskopieren oder eines der Programme verwenden, die versuchen aus einer PDF-Datei wieder eine DOC-Datei zu machen.