3 Punkte von GN⁺ 2025-03-24 | 2 Kommentare | Auf WhatsApp teilen
  • Mozilla.ai ist überzeugt, dass künstliche Intelligenz (AI) viele Möglichkeiten bietet, Communities durch offene Zusammenarbeit zu stärken.
  • Diese Chancen müssen sorgfältig gestaltet werden, während die Sorge über einen übermäßigen Einsatz von AI wächst.
  • Vor diesem Hintergrund wurde der OpenStreetMap AI Helper Blueprint entwickelt und veröffentlicht.
  • Warum OpenStreetMap?
    • Daten sind ein zentraler Bestandteil von AI-Anwendungen, und OpenStreetMap verfügt über eine aktive Community, die die vollständigste offene Kartendatenbank pflegt.
    • OpenStreetMap bietet vielfältige Daten wie Straßen, Bahnhöfe und mehr und eröffnet in Kombination mit Satellitenbildern unbegrenzte Möglichkeiten zum Training verschiedener AI-Modelle.
    • Ziel ist es, mit AI die langsamen Teile des Kartierungsprozesses zu beschleunigen und zugleich bei den wichtigen Schritten die menschliche Prüfung beizubehalten.
  • Warum Computer Vision?
    • Viele Kartenobjekte werden als Polygone dargestellt, und das Auffinden und Einzeichnen dieser Objekte ist zeitaufwendig.
    • Computer-Vision-Modelle können diese Aufgaben bei ausreichender Datenbasis leicht übernehmen.
    • Für Objekterkennung und Segmentierung werden die Modelle YOLOv11 und SAM2 verwendet; sie sind leichtgewichtig, schnell und lokal gut einsetzbar.
  • OpenStreetMap AI Helper Blueprint
    • Schritt 1: Objekterkennungs-Datensatz aus OpenStreetMap erstellen
      • OpenStreetMap-Daten werden mit Satellitenbildern kombiniert und in ein für das Training geeignetes Format umgewandelt.
      • Mit der Nominatim API und der Overpass API werden Daten für interessante Gebiete heruntergeladen und im Ultralytics-YOLO-Format gespeichert.
    • Schritt 2: Objekterkennungsmodell feinabstimmen
      • Das YOLOv11-Modell wird feinabgestimmt und auf den Hugging Face Hub hochgeladen.
    • Schritt 3: Zu OpenStreetMap beitragen
      • Mit dem feinabgestimmten Modell wird auf mehreren Tiles Inferenz ausgeführt; neue Objekte werden anschließend manuell überprüft und nach OpenStreetMap hochgeladen.
  • Abschließende Gedanken
    • OpenStreetMap ist ein starkes Beispiel für offene Zusammenarbeit beim Aufbau einer gemeinschaftsgetriebenen Weltkarte.
    • Der OpenStreetMap AI Helper Blueprint zeigt, dass AI menschliche Beiträge verbessern kann, und unterstreicht den Wert hochwertiger Daten.
    • Mit dem Blueprint lassen sich in derselben Zeit etwa fünfmal so viele Schwimmbecken kartieren wie in reiner Handarbeit.
    • Es wird empfohlen, mit dem Training von Modellen für andere Kartenobjekte zu experimentieren; außerdem kann man zum Projekt beitragen oder es erweitern.

2 Kommentare

 
depth221 2025-03-24

Soweit ich gesehen habe, wird „Map Feature“ üblicherweise mit (Karten-)Objekt übersetzt.

 
GN⁺ 2025-03-24
Hacker-News-Kommentare
  • Grüße von der OpenStreetMap Foundation. Von KI erkannte Features sollten nicht direkt in die Datenbank eingetragen werden

    • Algorithmen haben Probleme mit Fehlalarmen und damit, lineare oder rechteckige Objekte verzerrt zu kartieren
    • Als Werkzeug zum Erkennen fehlender Features ist das nützlich, aber es braucht menschliches Eingreifen, um zu prüfen, ob erkannte Objekte korrekt eingezeichnet wurden
    • Die entsprechenden Richtlinien finden sich im OpenStreetMap-Wiki
  • Nach der Erkennung von Swimmingpools würde ich gern auch die Erkennung von Solaranlagen ausprobieren

    • Viele sind nicht der Meinung, dass OSM allein durch manuelle Arbeit wachsen kann
    • Ich habe in 10 Jahren 60.000 Änderungen vorgenommen, aber allein mit der Begeisterung menschlicher Freiwilliger lässt sich Mapping im globalen Maßstab nicht bewältigen
    • Wir brauchen ein skalierbares Framework, mit dem sich Datenqualität, Herkunft, Methoden zur Fehlermeldung und Hinweise für Datennutzer annotieren lassen
    • Zum Beispiel könnte man Abfragen wie „Unternehmen des Typs X, die im letzten Jahr von Menschen kartiert wurden“ ausführen; bis zu einem gewissen Grad geht das mit dem „check date“
    • Aber man weiß nicht, wie genau die Attribute sind oder ob der Mapper nur Namen/Position geprüft hat
    • Es könnte sinnvoller sein, die Öffnungszeiten aller Orte zu sammeln, um die Daten monatlich automatisch aktuell zu halten
    • Als Datennutzer wäre es vielleicht besser, wenn man nur nach bestimmten vertrauenswürdigen Quellen filtern könnte
    • Selbst mit Einschränkungen wie KI-inferierten POIs könnte man die Daten verwenden
  • Nachdem ich automatisiertes Mapping selbst erlebt habe, bin ich sehr vorsichtig geworden

    • Ich bin mit dem Motorrad durch Südamerika gereist, und in OSM gab es viele Bearbeitungen, die automatisiert wirkten, sodass es in manchen Regionen nahezu unbrauchbar war
    • Das passierte nicht nur auf Landstraßen, sondern auch in ziemlich großen Städten
  • Ich habe vor einigen Jahren in diesem Bereich gearbeitet

    • Es gibt bereits viele bestehende Modelle, Datensätze, Tools usw.
    • Relevantes Material ist auf GitHub zu finden
  • Wir kartieren nicht das, was auf Satellitenbildern zu sehen ist, sondern die tatsächlichen Gegebenheiten vor Ort

    • Man sollte nichts beitragen, was von KI halluziniert wurde
  • Google erlaubt das nicht, Mapbox aber schon, wenn es für nichtkommerzielle Zwecke oder für OSM verwendet wird

    • Mit den Satellitenbildern von Mapbox kann man abgeleitete Vektor-Datensätze erzeugen
  • Ich wünschte, Mozilla würde sich darauf konzentrieren, einen guten Browser zu bauen

  • Ich habe vor einigen Monaten etwas Ähnliches gemacht (kleinräumige Geodaten)

    • Relevantes Material ist auf GitHub zu finden
  • Ich würde gern Details dazu sehen, wie man SAM/2 feinabstimmt, um Swimmingpools oder Solarfelder zu erkennen

    • Das wäre für ein Projekt zur Widerstandsfähigkeit von Gemeinschaften nützlich, aber ich konnte bei der Feinabstimmung von SAM2 nicht mithalten
    • Das Yolov8-Modell findet und segmentiert Solaranlagen gut, aber die Ränder sind sehr schlecht, sodass viel Nacharbeit nötig ist
    • Die mit SAM2 trainierten Ergebnisse sehen deutlich besser aus
    • Wegen Genauigkeitsproblemen würde ich das nicht zu OSM hinzufügen, aber anderswo könnte man es verwenden
  • Früher nannte man das „Heads-up-Digitalisierung“