- Ein leistungsstarkes Tool zur Umwandlung von HTML in sauberes, gut lesbares Markdown
- Unterstützt komplexe Formatierungen und bietet über benutzerdefinierte Optionen und Plugins vollständige Kontrolle über den Konvertierungsprozess
- Kann als Golang-Bibliothek oder per CLI-Befehl verwendet werden; außerdem direkt über die Online-Demo oder die REST API ausprobierbar
Hauptfunktionen
- Bold & Italic: Unterstützt Fett- und Kursivformatierung auch innerhalb von Wörtern
- List: Unterstützt perfekt verschachtelte geordnete und ungeordnete Listen
- Blockquote: Kann andere Elemente innerhalb von Zitaten enthalten und unterstützt auch verschachtelte Zitate nahtlos
- Inline Code & Code Block: Verarbeitet Backticks und mehrzeilige Codeblöcke korrekt, um die Codestruktur zu erhalten
- Link & Image: Formatiert mehrzeilige Links korrekt und fügt Escaping für Leerzeilen hinzu
- Smart Escaping: Escaped Sonderzeichen nur dann, wenn es nötig ist, um unbeabsichtigtes Markdown-Rendering zu verhindern
- Remove/Keep HTML: Bietet die Möglichkeit, bestimmte HTML-Tags zu entfernen oder beizubehalten
- Plugin: Plugins lassen sich leicht erweitern, oder es können benutzerdefinierte Plugins zur Funktionserweiterung erstellt werden
- Falls benutzerdefinierte Logik erforderlich ist, kann entsprechender Code geschrieben und registriert werden
- Wenn die Standardeinstellungen nicht gefallen, kann
PriorityEarly verwendet werden, um Logik vor anderen Regeln auszuführen
Converter kann in mehreren Goroutinen verwendet werden und nutzt intern einen Mutex
1 Kommentare
Hacker-News-Kommentare
Mit der kostenlosen API von Jina.ai kann man ohne Authentifizierung oder API-Key eine URL abrufen und ein Markdown-Dokument erhalten
Ich frage mich, ob sich dieses unter der MIT-Lizenz stehende Tool als Alternative zu p2k, Instapaper usw. zum Lesen auf dem Kindle nutzen lässt
Ich verwende diese Bibliothek in einer Lambda-Funktion, um URLs in Markdown umzuwandeln und in S3 zu speichern
Nützlich, um LLMs mit Webseitendaten zu versorgen
Es wäre gut, wenn das Tool eine n-Gramm-Deduplizierungsfunktion hätte
Mit Urlbox kann man exakte Screenshots und Markdown von Webseiten erhalten
RedditToMarkdown und urltomarkdown.com sind nützlich, um LLM- und AI-Apps zu bauen
Ich suche nach einer ähnlichen Bibliothek für den Einsatz in einer Kotlin/Spring-App
Eine der Schwierigkeiten bei der Nutzung dieses Tools ist die Verarbeitung von Code-Blöcken mit Syntax-Highlighting