-
Ein Datenrecherche- und Analysetool für investigativen Journalismus, entwickelt von OCCRP, das sich auf Recherchen zu organisierter Kriminalität und Korruption spezialisiert
-
Integrierte Quersuche über strukturierte (DB) und unstrukturierte Daten (PDF, XLS, DOC usw.)
-
Funktionen zur Datensegmentierung und Zugriffsverwaltung. Unterstützt flexible gemeinsame Nutzung zwischen multinationalen Teams
-
Kontinuierliches Crawling aus Hunderten öffentlicher Datenquellen
-
Bietet visuelle Recherche- und Analysefunktionen
-
Unterstützt den Datenimport
-
Von HTML/XML über PDF, RTF, Epub bis zu den meisten Office-Dokumenten (Doc, PPT)
-
Tabellenformate wie XLS/CSV sowie DBF, SQLite, Access
-
E-Mails im Format RFC822 MIME, Mailboxen wie Outlook PST/OLM, Mbox, Vcard
-
Zip, Rar, Tar, 7Zip, Gzip
-
Bei JPEG, PNG, GIF, TIFF, SVG wird per OCR mit Tesseract 4 oder der Google Vision API Text extrahiert
1 Kommentare
OCCRP, die Organisation dahinter, ist so ein Ort.
„OCCRP, ein auf organisierte Kriminalität und Korruption spezialisiertes investigatives Medium“ https://newstapa.org/article/_DNLi
Unter https://aleph.occrp.org/ können Sie es mit echten Daten ausprobieren.
Ein Trailer-Video von OpenOil erklärt Aleph auf leicht verständliche Weise.
( OpenOil ist ein Unternehmen, das ein offenes Daten-Framework zur Verwaltung natürlicher Ressourcen wie Gas, Öl und Kohle auf der ganzen Welt entwickelt. )
https://www.youtube.com/watch?v=bg96HcR_2Jc
Da es von einer auf „Korruption“ spezialisierten Rechercheorganisation entwickelt wurde, ist das grundlegende Datenmodell „Follow the Money“.
Es verfolgt sehr gut, wie Geld zwischen Unternehmen bzw. Personen fließt.
Daher werden standardmäßig folgende Arten von Datensatzobjekten unterstützt.