Tipps zur Internetsuche
(gwern.net)-
Eine Zusammenstellung der Grundlagen und wichtiger Tipps für die Suche nach Informationen zu wissenschaftlichen Arbeiten, Webseiten, Büchern usw. im Internet
-
Ein Artikel von Gwern Branwen*, den ich unter den persönlichen Webseiten für den besten halte. Hier ist nur ein Teil wiedergegeben, daher bitte unbedingt auch das Original lesen
[ Suche nach wissenschaftlichen Arbeiten ]
-
Suchsyntax: boolesche Operatoren, wichtige Google-Befehle (doppelte Anführungszeichen für exakte Übereinstimmung, Bindestrich für Negation/Ausschluss,
site:für die Suche auf einer bestimmten Website) -
Hotkeys für schnelle Suche einrichten: AutoHotkey, Quicksilver, XMonad usw.
-
Tastenkürzel im Webbrowser: C-l, C-PgUp/C-PgDwn, C-w, C-t/C-T, M-[1–9]
-
Bei Google Scholar die HTML-Ansicht verwenden
-
Tipps für die Suche nach Paper-Titeln
→ Den Titel kürzen oder AND/OR sowie - verwenden, um die Suchergebnisse zu reduzieren
→ Versuchen, das Jahr hinzuzufügen oder zu entfernen
→ Den Datumsbereich von Google nutzen
→ site:archive.org hinzufügen, um im Internet Archive zu suchen
- Schwierige Fälle
→ Reverse Citations: In Google Scholar „related articles“ und „cited by“ ansehen
→ Master-/Doktorarbeiten über ProQuest
→ Reverse Image Search: mit Google Bilder, TinEye und Yandex
- Suchtipps nach Domain
→ Twitter: Wird zwar auch von Google erfasst, aber wenn man zusätzliche Informationen kennt, ist die erweiterte Twitter-Suche ebenfalls hervorragend (from:, to:, since:, until:, near:, url: ..)
→ US-Bundesgerichte: Registrierung bei Pacer erforderlich. Kostenpflichtig ($0.1/Seite), aber unter insgesamt $15 kostenlos. Es gibt auch einen öffentlichen Mirror namens Recap. Eine Recap-Browser-Erweiterung wird ebenfalls angeboten
→ Wellcome Library: Viele alte Zeitschriften/Bücher. Wegen schlechter SEO in Google usw. schwer zu finden, daher genau nachsehen
→ Alte Zeitschriften: site:pdf-giant.net, bildungsbezogene Suche über ERIC (site:eric.ed.gov)
- Umgang mit Paywalls
→ Bei Büchern/Papern kann man über Libgen / Sci-Hub zugreifen. Volltextsuche ist über Z-Library möglich
- Wenn sich mit allen oben genannten Methoden nichts finden lässt, kann man andere um Hilfe bitten
→ Subreddit: /r/scholar
→ Twitter: #icanhazpdf
→ Wikipedia Resource Request
→ LessWrong HelpDesk
- Was man tun sollte, nachdem man eine Full-Text Copy gefunden hat
→ Nicht auf nicht vertrauenswürdige Hosts verlinken: Libgen/Sci-Hub, Nber, Scribed, ResearchGate..
→ Bei Scans mit gscan2pdf bearbeiten & OCR ausführen
→ Metadaten hinzufügen: ExifTool, pdftk
→ Wenn möglich öffentlich hosten und den Link auf Wikipedia/Reddit teilen
→ PDF-Link-Tipp: An die URL #page=N anhängen, um eine Seite direkt anzugeben
- Fortgeschrittenes
→ Mit Archiver-Bots den Suchverlauf automatisch archivieren
→ GCSE (Google Custom Search Engine) erstellen
[Webseiten]
-
Wenn man den Titel kennt, nur nach dem Titel suchen
-
Bei URL-Suchen unnötige Parameter entfernen
-
Bei Google mit
site:die Suche auf eine Domain und einen Datumsbereich beschränken -
Andere Suchmaschinen als Google verwenden
→ DuckDuckGo: Mit der Bangs-Funktion direkte Suche auf externen Websites (derzeit Unterstützung für mehr als 13.000 externe Websites)
→ Bing/Yandex sind ebenfalls nützlich
- Archive prüfen: Internet Archive oder das Meta-Archiv Memento
→ IA bietet eine Funktion zum Prüfen kompletter Domain-URLs. Mit wayback_machine_downloader (Ruby) lässt sich alles herunterladen
→ Bevor Google Reader eingestellt wurde, hat Archive Team ziemlich viele RSS-Feeds von Google Reader gesichert und auf IA gehostet (auch als WARC möglich, am Ende gibt es Download- & Suchtipps)
→ archive.today: ein ähnlicher Mirror wie IA
→ Wenn gar nichts anderes funktioniert, kann man auch Google Cache verwenden
[Digitale Bücher]
-
Bücher gibt es nicht in Google Scholar. Dafür die Google-Suche verwenden.
-
Zuerst mit
filetype:pdfsuchen und danach Libgen verwenden -
Auch bei IA gibt es viele Bücher, aber wegen schwacher SEO sind sie schwer zu finden.
"Buchtitel site:archive.org"
→ Wenn ein Buch auf IA DRM-geschützt ist, kann man das De-DRM-Plugin von Calibre verwenden
- Auch bei HathiTrust gibt es viele Buchscans
→ Vollständiger Download ist nicht möglich, aber es gibt eine Umgehungsmethode mit wget. Diese lässt sich auch auf die Wellcome Library anwenden
[Gedruckte Bücher]
- Mit Google Books oder find-more-books.com nach gebrauchten Büchern suchen
→ eBay & Amazon sind für den Kauf gebrauchter Bücher nicht besonders gut. Nur die Informationen ansehen
→ AbeBooks, Thrift Books, Better World Books, B&N usw. eignen sich gut zum Kauf
- Bücher scannen: Tipps zu destruktiven vs. nicht-destruktiven Methoden, Schneidwerkzeugen, Metadaten und PDF-Erstellung
- Gwern Branwen ist freier Autor und Forscher. Er betreibt die persönliche Website https://www.gwern.net/, die wirklich einzigartig ist
Für mich ist sie unter persönlichen Webseiten/Blogs absolut die Spitzenklasse. Seine besondere Stärke ist es, sich ein bestimmtes Thema vorzunehmen und es detailliert zu durchdringen, zu ordnen und aufzubereiten.
→ Top 5 der Bücher, die Menschen laut GoodReads angefangen und dann aufgegeben haben: https://de.news.hada.io/topic?id=1231
1 Kommentare
Ich empfehle auch den zuvor veröffentlichten Beitrag „Tipps zur Informationssuche für Entwickler“. https://de.news.hada.io/topic?id=2932