- Leitfaden zum Bearbeiten von PDF-Textinhalten: ohne kommerzielle Tools wie Adobe Acrobat
- Wichtiger Leitfaden für Mac-Nutzer: Erwähnt Tools, die auch auf den meisten Linux-Distributionen verfügbar sind
- Komprimierte Speicherung von Textdaten in PDFs: Dekomprimierung mit dem Kommandozeilen-Tool
qpdf
- Überprüfung der Textdaten nach der Dekomprimierung: im Texteditor, einschließlich Kodierung und Zuordnung zu bestimmten Schriftarten
- Komplexität der Textkodierung in PDFs: verschiedene mögliche Kodierungen, einschließlich benutzerdefinierter Kodierungen, die in der Datei selbst enthalten sind
- Extraktion von Kodierungsinformationen: mit dem Kommandozeilen-Tool
pdffonts
- Bietet ein Beispiel dafür, wie man die mit eingebetteten Kodierungen verknüpften Schriftarten identifiziert und die eingebetteten Kodierungstabellen dieser Schriftarten findet
- Kodierungstabellen: Zuordnung benutzerdefinierter Kodierungspunkte zu Unicode-Punkten
- Umwandlung der Tabellen mit Python: Umwandlung der Tabellen in Dictionaries sowie Schreiben von Kodier- und Dekodierfunktionen
- Ersetzen des Originaltexts mit diesen Funktionen: Der Originaltext kann durch benutzerdefiniert kodierten Ersatztext ersetzt werden
1 Kommentare
Hacker-News-Kommentare
mutoolkönnen verwendet werden, um PDF in eine Version ohne komprimierte Daten umzuwandeln, sodass sie leichter zu verstehen und zu bearbeiten ist.qpdfundRUPSkönnen verwendet werden, um die Struktur eines PDF zu analysieren und zu bearbeiten.