Sie sind hier

Seltsamer Effekt bei Textauswahl in PDF-Dokument

Mein Problem ist, dass ich mit meinem PDF-Viewer (Acrobat Reader 7.0.7 oder KPdf 3.5.5) einen seltsamen Effekt erlebe, sobald ich Text markieren und kopieren möchte -- zusätzlich wird auch die Durchsuchbarkeit des PDF unmöglich.

Als Beispiel diene folgender Brief:

\documentclass{scrlttr2}

\usepackage{german}
\usepackage[T1]{fontenc}
\usepackage[latin1]{inputenc}

\renewcommand{\familydefault}{\sfdefault}

\begin{document}

\begin{letter}{Empfängername\\Empfängerstraße\\PLZ Ort}
\setkomavar{subject}{Betreff}
\opening{Sehr geehrte Damen und Herren,}

Markiert das!

\closing{Mit freundlichen Grüßen,}
\end{letter}

\end{document}

Ich habe schlicht und einfach versucht, eine serifenlose Schriftart für den Brief festzulegen. Um ein PDF zu generieren, gebe ich in der Konsole (Opensuse 10.1) z.B.

latex test.tex && dvips test.dvi && ps2pdf test.ps

ein. Da ich weiß, dass die LaTeX-Distribution meiner Linux-Installation ein wenig alt ist (KOMA-Script stammt dort vom September 2004) habe ich das zusätzlich unter Windows mit einem aktuellen MiKTeX (hier ist KOMA-Script bzw. die Klasse scrlttr2 immerhin in der Version 2.95b enthalten) auch versucht. In beiden Fällen ist das Ergebnis gleich: Versuche ich mit dem Textauswahlwerkzeug des Acrobat Reader Text auszuwählen werden keine Wort- oder Zeilengrenzen berücksichtigt -- es wird einfach zu viel ausgewählt. Außerdem werden undefinierbare Zeichen kopiert.

Ich hoffe, mein Problem wird auch in einer anderen Umgebung als der meinen klar.

Viele Grüße
Franz

forum: 
Bild von Markus Kohm

Das Paket cmap wurde geschrieben, um Probleme mit dem Mapping von Zeichen in PDF-Dateien zu lösen. Ob sich damit allerdings auch das Leerzeichenproblem lösen lässt, kann ich nicht sagen. Das Problem entsteht wohl daher, dass TeX kein Leerzeichen kennt, sondern horizontalen Abstand einfügt. Programme, die aus dem gesetzten Dokument wieder den Text extrahieren, müssen heuristisch auf dem Abstand darauf schließen, ob es sich dabei um Kerning o. ä. oder aber um Wortabstand handelt. Das kann funktionieren, kann aber auch fehlschlagen.

Ein anderes Problem könnte sein, dass die EC-Fonts bei Dir eventuell nicht als Type-1 vorhanden sind. Seltsamerweise hat der Acro/AdobeReader mit Type-3-Fonts ein sehr viel größeres Mapping-Problem. Das kannst Du beseitigen, indem Du cm-super installierst oder LM-Fonts (Paket lmodern) verwendest. Für letzteres müssen die LM-Fonts natürlich installiert sein.

Ich habe übrigens mit Deinem Beispiel keine Selektionsprobleme (per copy&paste eingefügt):

Empfängername
Empfängerstraße
PLZ Ort
10. November 2006
Betreff
Sehr geehrte Damen und Herren,
Markiert das!
Mit freundlichen Grüßen,

AdobeReader 7.0.8 unter Linux.

Vielen Dank für die Vorschläge! Das Paket cmap in meiner Situation zu verwenden brachte nichts, vermutlich habe ich nicht deutlich genug herausgestellt, dass ich *nicht* pdflatex verwende, sondern den Umweg über dvips gehen möchte. Soweit ich das Readme zu cmap verstehe, wurde dieses Paket explizit für pdflatex entwickelt. Verwende ich es trotzdem, bricht latex so ab:

pdfTeX error (ext1): \pdfobj used while \pdfoutput is not set.
reserved@a ->immediate pdfobj
stream file {reserved@f }expandafter xdef csna...
l.100 \fontencoding\encodingdefault\selectfont

Das ist nicht so schlimm, schließlich funktioniert es, so wie ich es will, wenn ich die LM-Fonts einbinde.

Bild von Markus Kohm

Dann liegt das ursprüngliche Problem mit großer Wahrscheinlichkeit wirklich daran, dass die EC bei Dir nicht als Type-1, sondern als Pixelfont im Type-3-Format eingebunden wurden. Höchst wahrscheinlich ist also cm-super nicht installiert.

Wenn Du allerdings mit LM (Paket lmodern) zufrieden bist, solltest Du dabei bleiben. Ich finde LM ohnehin schöner und besser als EC.

Comments for "Seltsamer Effekt bei Textauswahl in PDF-Dokument" abonnieren