22 Punkte von xguru 2022-04-20 | 11 Kommentare | Auf WhatsApp teilen
  • „Das Scrapen öffentlich zugänglicher Daten ist legal (kein Verstoß gegen den CFAA)"
  • In der Klage von LinkedIn, mit der das Unternehmen das Scraping durch die Analysefirma Hiq verbieten wollte, wurde das frühere Urteil bestätigt (LinkedIn hatte bereits 2019 verloren)
  • Gute Nachrichten für Webarchive, die Wissenschaft, Forschende und Journalist:innen
  • Ein US-Gericht hat dabei den jahrzehntealten CFAA (Computer Fraud and Abuse Act) erneut geprüft
    • Der Verstoß wird auf Personen beschränkt, die sich „unbefugt Zugang“ zu Computersystemen verschaffen
    • Auf öffentliche Websites ist das Konzept von „unbefugt“ nicht anwendbar

11 Kommentare

 
devsejong 2022-04-20

Ich frage mich, ob Web Scraping auch in Korea rechtlich unproblematisch ist.
Falls jemand damit Erfahrung hat, könnte er sie vielleicht teilen?

 
nullvana 2022-04-25

Nach unserer Regulierungslage

  1. Personenbezogene Kreditinformationen
    Dabei geht es nicht um den „Kredit“ der Kreditkarte. Dienste, die es der betroffenen Person ermöglichen, Daten einzusehen, aus denen sich der finanzbezogene Ruf einer Person ableiten lässt (Kontostand, Transaktionsverlauf usw.), sind verboten. Dafür braucht man eine Lizenz als Anbieter für die Verwaltung persönlicher Kreditinformationen. Wenn die Daten aber nicht von der Person selbst eingesehen werden können und einfach nur als Unterlagen verwendet werden, etwa wie bei einer Steuererklärung, gibt es kein Problem. Hm...?

  2. Selbst wenn man auf einer Webseite per Crawling oder Scraping an die gewünschten Informationen kommt, ist alles illegal, was etwa die Bezahlseite umgeht oder Daten erlangt, die über das hinausgehen, was auf dem Bildschirm bereitgestellt bzw. beabsichtigt ist. Auch wenn es nicht als JSON auf dem Bildschirm angezeigt wird, wird es ja zwischen FE und BE hin- und hergeschickt; eine Nutzung entgegen der beabsichtigten Verwendung ist illegal. Ich meine, ich habe mal eine Nachricht gesehen, dass jemand festgenommen wurde, weil er kostenlos Registerauszüge vom Justizministerium gezogen hat.

Nun ja, Punkt 2 kann ich aus Schutzgründen eher nachvollziehen, weil finanzschwache Finanzunternehmen (Versicherungen/Karten-/Wertpapierfirmen usw. ... außer Banken) oft nicht die Kapazitäten haben und es viele Lücken gibt ... Aber Punkt 1 wirkt wirklich wie reine Fehlarbeit. Auch bei 1 verstehe ich die Absicht im Rahmen der Datensouveränität, aber die konkrete Ausgestaltung wirkt auf mich wie ActiveX 3.0?

 
devsejong 2022-04-21

Vielen Dank an alle, die einen Kommentar hinterlassen haben! Das hat mir sehr geholfen.

 
ninebow 2022-04-21

In dem Newsletter, den ich abonniert habe, gab es vor Kurzem einen Link zu einem ähnlichen Thema, den ich hier teilen möchte.

Zusammen mit dem von rtyuiop unten erwähnten Fall JobKorea vs. Saramin sind dort auch die Fälle Yeogi Eottae vs. Yanolja und Naver vs. Darwin Brokerage zusammengefasst.
https://stibee.com/api/v1.0/…==

 
xguru 2022-04-21

Oh, der Packle-Newsletter ist gut. Danke für den Link~!

 
ninebow 2022-04-21

Vielen Dank, ich lese immer mit großem Dank (_ _)

 
rtyuiop 2022-04-20

Soweit ich weiß, ist der bekannteste Fall hierzulande der, in dem Yeogieottae die Daten von Yanolja gecrawlt hat. Meinem Verständnis nach handelte es sich zwar um öffentliche Daten und das Crawling selbst war kein Problem, aber die Hauptstreitpunkte waren (1) der Schaden, den Yanolja durch die erhöhte Serverlast erlitten hat, und (2) der Schaden, der Yanolja dadurch entstand, dass es sich um zwei Marken aus derselben Branche handelt. Das Verfahren läuft noch, und da die Stoßrichtung der Berichterstattung je nach Artikel unterschiedlich ist, scheint es mir sinnvoll, selbst verschiedene Quellen dazu zu lesen.

 
tingo29 2022-04-20

Im Finanzsektor ist Scraping seit dem Start von MyData verboten.

https://news.einfomax.co.kr/news/articleView.html?idxno=4192027

 
tribela 2022-04-20

Ich habe einmal mit einem Anwalt, den ich kenne, darüber gesprochen, und damals hieß es sinngemäß: „Das bloße Einsammeln öffentlich zugänglicher Informationen ist zunächst kein Problem, aber sobald es irgendeine Form von Schutz gegen Crawling gibt, kann es problematisch werden, wenn man diese umgeht, um die Daten zu speichern.“
Wie so oft schaut das Recht offenbar weniger auf das Technische als darauf, welche Absicht dahinterstand.

 
xguru 2022-04-20

Es geht hier zwar um persönliche Profilinformationen auf LinkedIn, daher fühlt sich das etwas heikel an, aber …
ich denke trotzdem, dass es schwierig wäre, selbst das Scraping von öffentlich zugänglichen Informationen zu verbieten.

Stand des Web-Scrapings im Jahr 2021

 
joone 2022-04-26

Es gibt auch viele Informationen, die auf LinkedIn öffentlich zugänglich sind. Trotzdem ist LinkedIn eine der am schwierigsten zu scrapenden Websites. Aber irgendwie sammelt man die Seiten trotzdem. Es ist ein Kampf zwischen Speer und Schild.