Vorstellung von en.osm.town
- en.osm.town ist Teil eines dezentralen sozialen Netzwerks auf Basis von Mastodon
- Eine unabhängige Community der OpenStreetMap-Community, finanziell unterstützt von der OpenStreetMap Foundation
- Server-Statistik: 257 aktive Nutzer
Kernaussagen
- Grant Slater schlägt AI-Unternehmen vor, OpenStreetMap-Daten nicht heimlich zu scrapen, sondern stattdessen 10.000 US-Dollar zu spenden
- Bei einer Spende von 50.000 US-Dollar könnten auch Echtzeit-Streaming-Updates bereitgestellt werden
- Bart Louwers erwähnt, dass OpenStreetMap-Scraping weit verbreitet sei
- wikiyu argumentiert, dass die Nutzung von planet.osm-Daten effizienter sei
- Josua kritisiert, dass AI auf ineffiziente Weise trainiert werde
- Juan Luis erwähnt, dass es auch bei Read the Docs ähnliche Probleme mit dem Missbrauch durch AI-Crawler gebe
- Simon Poole behauptet, dass ein vernünftiger Ansatz das Image von AI-Unternehmen beschädigen könnte
- Michał bringt die Möglichkeit ins Spiel, dass Auftragnehmer in bestimmten Ländern den Auftrag erhalten haben könnten, OSM-Daten herunterzuladen
- leadingzero kritisiert, dass die Lizenzanforderungen von OSM nicht ordnungsgemäß durchgesetzt würden
- Grant Slater erwähnt, ein GitHub-Repository zur Nachverfolgung von Tile-Eigenschaften erstellt zu haben
- Guillaume Rischard erwähnt, kürzlich rechtliche Probleme in Deutschland gelöst zu haben
- Adderall girl grindset (Jes) schlägt vor, AI-Crawler zu blockieren
Zusammenfassung von GN⁺
- Dieser Beitrag behandelt das Problem von AI-Unternehmen, die OpenStreetMap-Daten scrapen
- Es werden effiziente Wege zur Nutzung von OpenStreetMap-Daten sowie ein spendenbasierter Ansatz für den Datenzugang vorgeschlagen
- Diskutiert werden außerdem der Missbrauch durch AI-Crawler und mögliche Gegenmaßnahmen
- Projekte mit ähnlichen Funktionen sind unter anderem Google Maps und Bing Maps
1 Kommentare
Hacker-News-Kommentare
robots.txt, verwenden keine öffentlichen APIs und halten Spitzenlasten nicht ein, wodurch die Infrastrukturkosten steigendocker run-Befehl möglichplanet.osmper Torrent verteilt und Scraping nur noch über Torrent erlaubt, könnte die Netzwerklast verteilt werden