<p>- Liest Inhalte aus PDF, LaTeX und PubMed Central XML mithilfe von Machine Learning und wandelt sie in HTML um <br />
- Ziel ist eine bessere Barrierefreiheit <br />
- Ein experimenteller Prototyp von Semantic Scholar, der KI-basierten Suchmaschine für Forschungsmaterialien <br />
- Derzeit werden nur extrahierte Bilder/Inhalte zwischengespeichert und das System wird lediglich genutzt, um Personen, die dasselbe Dokument hochgeladen haben, den Dienst schneller bereitzustellen. Hochgeladene Dateien werden nicht gespeichert <br />
- Einschränkungen<br />
→ Tabellen werden als Bilder extrahiert <br />
→ Mathematische Inhalte sind ungenau oder werden kaum extrahiert <br />
→ Die Verarbeitung von LaTeX/PubMed kann gegenüber PDF in einigen Funktionen eingeschränkt sein <br />
- Es ist geplant, künftig Barrierefreiheitsfunktionen zu Semantic Scholar hinzuzufügen </p>
3 Kommentare