Tipps zur Internetsuche

(gwern.net)

35 Punkte von xguru 2021-04-26 | 1 Kommentare | Auf WhatsApp teilen

Eine Zusammenstellung der Grundlagen und wichtiger Tipps für die Suche nach Informationen zu wissenschaftlichen Arbeiten, Webseiten, Büchern usw. im Internet
Ein Artikel von Gwern Branwen*, den ich unter den persönlichen Webseiten für den besten halte. Hier ist nur ein Teil wiedergegeben, daher bitte unbedingt auch das Original lesen

[ Suche nach wissenschaftlichen Arbeiten ]

Suchsyntax: boolesche Operatoren, wichtige Google-Befehle (doppelte Anführungszeichen für exakte Übereinstimmung, Bindestrich für Negation/Ausschluss, site: für die Suche auf einer bestimmten Website)
Hotkeys für schnelle Suche einrichten: AutoHotkey, Quicksilver, XMonad usw.
Tastenkürzel im Webbrowser: C-l, C-PgUp/C-PgDwn, C-w, C-t/C-T, M-[1–9]
Bei Google Scholar die HTML-Ansicht verwenden
Tipps für die Suche nach Paper-Titeln

→ Den Titel kürzen oder AND/OR sowie - verwenden, um die Suchergebnisse zu reduzieren

→ Versuchen, das Jahr hinzuzufügen oder zu entfernen

→ Den Datumsbereich von Google nutzen

→ site:archive.org hinzufügen, um im Internet Archive zu suchen

Schwierige Fälle

→ Reverse Citations: In Google Scholar „related articles“ und „cited by“ ansehen

→ Master-/Doktorarbeiten über ProQuest

→ Reverse Image Search: mit Google Bilder, TinEye und Yandex

Suchtipps nach Domain

→ Twitter: Wird zwar auch von Google erfasst, aber wenn man zusätzliche Informationen kennt, ist die erweiterte Twitter-Suche ebenfalls hervorragend (from:, to:, since:, until:, near:, url: ..)

→ US-Bundesgerichte: Registrierung bei Pacer erforderlich. Kostenpflichtig ($0.1/Seite), aber unter insgesamt $15 kostenlos. Es gibt auch einen öffentlichen Mirror namens Recap. Eine Recap-Browser-Erweiterung wird ebenfalls angeboten

→ Wellcome Library: Viele alte Zeitschriften/Bücher. Wegen schlechter SEO in Google usw. schwer zu finden, daher genau nachsehen

→ Alte Zeitschriften: site:pdf-giant.net, bildungsbezogene Suche über ERIC (site:eric.ed.gov)

Umgang mit Paywalls

→ Bei Büchern/Papern kann man über Libgen / Sci-Hub zugreifen. Volltextsuche ist über Z-Library möglich

Wenn sich mit allen oben genannten Methoden nichts finden lässt, kann man andere um Hilfe bitten

→ Subreddit: /r/scholar

→ Twitter: #icanhazpdf

→ Wikipedia Resource Request

→ LessWrong HelpDesk

Was man tun sollte, nachdem man eine Full-Text Copy gefunden hat

→ Nicht auf nicht vertrauenswürdige Hosts verlinken: Libgen/Sci-Hub, Nber, Scribed, ResearchGate..

→ Bei Scans mit gscan2pdf bearbeiten & OCR ausführen

→ Metadaten hinzufügen: ExifTool, pdftk

→ Wenn möglich öffentlich hosten und den Link auf Wikipedia/Reddit teilen

→ PDF-Link-Tipp: An die URL #page=N anhängen, um eine Seite direkt anzugeben

Fortgeschrittenes

→ Mit Archiver-Bots den Suchverlauf automatisch archivieren

→ GCSE (Google Custom Search Engine) erstellen

[Webseiten]

Wenn man den Titel kennt, nur nach dem Titel suchen
Bei URL-Suchen unnötige Parameter entfernen
Bei Google mit site: die Suche auf eine Domain und einen Datumsbereich beschränken
Andere Suchmaschinen als Google verwenden

→ DuckDuckGo: Mit der Bangs-Funktion direkte Suche auf externen Websites (derzeit Unterstützung für mehr als 13.000 externe Websites)

→ Bing/Yandex sind ebenfalls nützlich

Archive prüfen: Internet Archive oder das Meta-Archiv Memento

→ IA bietet eine Funktion zum Prüfen kompletter Domain-URLs. Mit wayback_machine_downloader (Ruby) lässt sich alles herunterladen

→ Bevor Google Reader eingestellt wurde, hat Archive Team ziemlich viele RSS-Feeds von Google Reader gesichert und auf IA gehostet (auch als WARC möglich, am Ende gibt es Download- & Suchtipps)

→ archive.today: ein ähnlicher Mirror wie IA

→ Wenn gar nichts anderes funktioniert, kann man auch Google Cache verwenden

[Digitale Bücher]

Bücher gibt es nicht in Google Scholar. Dafür die Google-Suche verwenden.
Zuerst mit filetype:pdf suchen und danach Libgen verwenden
Auch bei IA gibt es viele Bücher, aber wegen schwacher SEO sind sie schwer zu finden. "Buchtitel site:archive.org"

→ Wenn ein Buch auf IA DRM-geschützt ist, kann man das De-DRM-Plugin von Calibre verwenden

Auch bei HathiTrust gibt es viele Buchscans

→ Vollständiger Download ist nicht möglich, aber es gibt eine Umgehungsmethode mit wget. Diese lässt sich auch auf die Wellcome Library anwenden

[Gedruckte Bücher]

Mit Google Books oder find-more-books.com nach gebrauchten Büchern suchen

→ eBay & Amazon sind für den Kauf gebrauchter Bücher nicht besonders gut. Nur die Informationen ansehen

→ AbeBooks, Thrift Books, Better World Books, B&N usw. eignen sich gut zum Kauf

Bücher scannen: Tipps zu destruktiven vs. nicht-destruktiven Methoden, Schneidwerkzeugen, Metadaten und PDF-Erstellung

Gwern Branwen ist freier Autor und Forscher. Er betreibt die persönliche Website https://www.gwern.net/, die wirklich einzigartig ist

Für mich ist sie unter persönlichen Webseiten/Blogs absolut die Spitzenklasse. Seine besondere Stärke ist es, sich ein bestimmtes Thema vorzunehmen und es detailliert zu durchdringen, zu ordnen und aufzubereiten.

→ Top 5 der Bücher, die Menschen laut GoodReads angefangen und dann aufgegeben haben: https://de.news.hada.io/topic?id=1231

1 Kommentare

gguimoon 2021-04-28

Ich empfehle auch den zuvor veröffentlichten Beitrag „Tipps zur Informationssuche für Entwickler“. https://de.news.hada.io/topic?id=2932

Tipps zur Internetsuche

Verwandte Beiträge

1 Kommentare