Alle Jurten/Gers in der Mongolei mit Machine Learning zählen
(monroeclinton.com)- Ein Projekt wurde durchgeführt, um die Anzahl der Jurten (Gers) in der gesamten Mongolei mithilfe eines Machine-Learning-Algorithmus direkt zu zählen
- Ein YOLO-Modell wurde darauf trainiert, Jurten auf einzelnen Satellitenbildern zu identifizieren, und die großskalige Datenannotation wurde automatisiert
- Mit verteilten Servern, Docker Swarm und FastAPI verarbeiteten rund 120 Worker Bildkacheln parallel und aggregierten die Ergebnisse
- Am Ende wurden 172.689 Jurten gefunden, was zum Verständnis des städtischen Wachstums in der Mongolei und der Probleme der Wohninfrastruktur beiträgt
- Zusätzlich werden Einblicke in die Ger-Viertel der Mongolei sowie deren sozialen Hintergrund und Entwicklungsaufgaben gegeben
Jurten in der Mongolei mit Machine Learning zählen – Projektüberblick
Fragen zur modernen mongolischen Gesellschaft
- Um die Geschichte des Mongolischen Reichs und das heutige Bild der Mongolei zu verstehen, wurden statt klassischer Datenanalyse intensiv die Satellitenansichten von Google Maps erkundet
- Auf Satellitenbildern von Ulaanbaatar wurde eine über viele Kilometer reichende riesige Ansammlung von Jurten entdeckt, woraufhin der Entschluss fiel, ihre genaue Anzahl selbst zu zählen
Vorbereitung von Daten und Labels
- Satellitenbilder in Kachelform (256x256 px) wurden automatisch aus Google Maps gesammelt, vor allem aus der Umgebung von Ulaanbaatar
- Die Kacheln wurden in Label Studio importiert und Jurten einzeln manuell mit Bounding Boxes annotiert; so entstanden annotierte Daten
- Als Algorithmus für die Objekterkennung wurde YOLO11 (ultralytics) gewählt, und der annotierte Datensatz wurde für das Modelltraining verwendet
Modelltraining und Erweiterung des Datensatzes
- Zusätzlich zum Training eines Modells auf Basis von YOLO11 wurde der Automatisierungsgrad durch eine iterative Feedback-Schleife aus Labeln – Retraining – erneutem Labeln erhöht
- Anfangs war die Genauigkeit wegen fehlender Daten gering, doch durch wiederholte zusätzliche Annotationen und mehr Samples wurde die Erkennungsrate gesteigert
- Für das Modelltraining wurden statt eines Laptops GPU-Ressourcen von vast.ai gemietet und in einer Docker-Container-Umgebung im großen Maßstab genutzt. Nach Abschluss des Trainings wurden Modellergebnisse und Metadaten automatisch in einen S3-Speicher hochgeladen
Aufbau eines landesweiten Suchsystems
Optimierung des Suchbereichs
- Für die Gesamtfläche der Mongolei wurde die Zahl der Kacheln pro Zoomstufe berechnet
- Da die Bevölkerungsdichte niedrig ist, wurden mit overpass turbo Punkte extrahiert, an denen menschliche Siedlungen wahrscheinlich sind, um unbewohnte Gebiete auszuschließen
- Auf Basis eines Puffers von 2 km um diese Punkte wurde die tatsächlich zu prüfende Kachelmenge stark reduziert
Verteilte Verarbeitung im großen Maßstab
- Mit Docker Swarm wurde ein Cluster aus 8 Servern (insgesamt 128 vCPU) aufgebaut
- Trennung in API-Server (FastAPI) und Worker:
- API: verwaltet die Suchbereiche und Kachelmengen, die den Workern zugewiesen werden, sowie Fortschritt und Status
- Worker: beziehen Suchbereiche von der API, erkennen mit dem Modell Jurten in den entsprechenden Kacheln und registrieren die Ergebnisse bei der API
Aggregation der Ergebnisse
- Insgesamt wurden rund 270.000 Suchbereiche und mehrere Millionen Bilder parallel verarbeitet
- Am Ende wurden 172.689 Jurten auf Grundlage von Erkennungsergebnissen mit einer Wahrscheinlichkeit von mindestens 40 % bestätigt
- Der Datensatz wurde veröffentlicht, um Analysen zu Landnutzung, Hotels und der Verteilung von Jurten in der Nähe kleiner Bergwerke zu ermöglichen
Jurten und der soziale Kontext der Mongolei
Geschichte und Wandel der Ger-Gebiete
- Jurten waren historisch die traditionelle Wohnform der mongolischen Nomaden, doch im Zuge von Urbanisierung und Industrialisierung haben sich ihre Einsatzformen stark verändert
- Anfang des 20. Jahrhunderts wurden Jurten auch für öffentliche Zwecke wie temporäre Schulen genutzt; mit dem Bevölkerungszuzug in Großstädte entstanden in Ulaanbaatar und anderswo Ger-Viertel
„Bei der Volkszählung von 1979 lebten 51 % der Gesamtbevölkerung in Städten, was die rasche Urbanisierung der 1970er Jahre widerspiegelt. Wegen des Mangels an Wohnraum und Infrastruktur dehnten sich die Ger-Viertel an den Stadträndern aus.“
Urbanisierung und Herausforderungen bei der Infrastruktur
- Aus ländlichen Gebieten zugezogene Menschen brachten ihre Jurten mit in die Stadt und nutzten sie als Wohnraum, obwohl noch keine formelle Infrastruktur vorhanden war
- Mit der Einführung eines Gesetzes zum Landeigentum im Jahr 2002 wurde die rechtliche Formalisierung der Siedlungen in den Ger-Vierteln vorangetrieben
- Die Regierung verfolgt zwar Sanierungs- und Entwicklungsprogramme wie den Ulaanbaatar 2020 Master Plan, doch die tatsächliche Umsetzung verläuft eher langsam
„Grundstückseigentümer in Ger-Vierteln verkaufen oder tauschen ihr Land an Bauträger, damit neue Wohnungen entstehen; der Wert der Wohnungen liegt jedoch oft unter dem des Grundstücks, oder die Entwicklung schreitet nur langsam voran.“
Implikationen und Ausblick
- Das deutet darauf hin, dass die Formalisierung der Ger-Viertel und die Bereitstellung von Infrastruktur weiterhin gesellschaftliche und politische Aufgaben bleiben
- Das langfristige Ziel der mongolischen Regierung ist es, die Ger-Viertel mit Wohnraum, Wasser, Strom und anderer städtischer Infrastruktur zu versorgen
- Dafür sind datenbasierte Politikgestaltung und eine kontinuierliche Nachverfolgung erforderlich
Weitere Fragen zur Untersuchung
- Was sind in der Mongolei und in anderen Ländern die Hauptfaktoren für Urbanisierung und Industrialisierung?
- Worin unterscheiden sich Mongolen, die sich in Städten niederlassen, von denen, die bleiben?
- Welche Schwierigkeiten hat die Regierung bei der Entwicklung der Ger-Viertel?
- Welche Hintergründe führen zu unterschiedlichen Entwicklungsgeschwindigkeiten zwischen Ländern?
Literaturhinweise
- Referenzen auf zentrale Arbeiten, Berichte und Datenbanken zu Politik, Soziologie und Infrastruktur
- “Distributional Effects of Ger Area Redevelopment in Ulaanbaatar, Mongolia.”
- Ulaanbaatar 2020 Master Plan and Development Approach for 2030.
- “Educational Import: Local Encounters with Global Forces in Mongolia.”
- Mongolia: A Country Study. Federal Research Division, Library of Congress.
- Poverty Mapping in Mongolia with AI-Based Ger Detection Reveals Urban Slums Persist after the COVID-19 Pandemic. arXiv.
Schluss
- Mit Technologie und Daten werden soziale Probleme betrachtet und eine neue Perspektive auf gesellschaftlichen Hintergrund und Wohnmuster eröffnet
- Ein praktisches Anwendungsbeispiel für die Kombination verschiedener Techniken und Open-Source-Tools (Machine Learning, Docker, FastAPI usw.)
1 Kommentare
Hacker-News-Kommentare
Wenn in Städten von Ger-/Jurtensiedlungen die Rede ist, sollte man die kulturelle Bedeutung des Nomadenlebens und der Ger-Kultur nicht unterschätzen. Durch den jüngsten Klimawandel (Desertifikation) und aus wirtschaftlichen Gründen geben viele Menschen ihr Nomadenleben unfreiwillig auf und ziehen in die Nähe von Städten wie Ulaanbaatar. Oft betrachten sie das als vorübergehend und kommen nur widerwillig in die Stadt. Es geht nicht nur um Wohnungsmangel; der Umzug in eine Wohnung oder andere dauerhafte Bauten wird auch gemieden, weil das symbolisch bedeutet, das Nomadentum endgültig aufgegeben zu haben. Deshalb wird häufig ein Ger neben ein dauerhaftes Gebäude gestellt oder im Hof von Verwandten ergänzt und erweitert, um die kulturelle Identität zu bewahren. Solche Fälle sind auf den ersten Fotos zu sehen
Als ich vor ein paar Jahren die Mongolei mit dem Motorrad durchquerte, hat mich etwas überrascht: Selbst bei guten festen Häusern stand im Hinterhof immer ein Ger. Aus Sicht eines Außenstehenden fragte ich mich, warum man ein zweites Haus braucht, aber als ich Einheimische fragte, bekam ich nur einen Blick, als sei die Frage seltsam. Das Ger ist einfach tief in der Kultur verankert und dient als eine Art Statussymbol, zur Bewirtung von Gästen, für das Leben im Freien und für viele weitere Zwecke
Ich möchte von einer Erfahrung im Palast von Chiwa in Usbekistan berichten: Es war eindeutig ein traditioneller Palast mit Eingangstoren und vielen prächtigen Räumen, und doch gab es in einer Ecke eines vollständig ummauerten Innenhofs einen runden Platz, also einen eigenen Ort zum Aufstellen eines Gers. Die Khane dieser Region rühmten sich ebenfalls ihrer Abstammung von Dschingis Khan, und selbst wenn sie in der Stadt lebten, galt es als eines Khans unwürdig, unter einem dauerhaften Dach zu übernachten; auch besuchende Verwandte hätten so etwas nicht gern gesehen
Toshhovli Palace Wiki
[Foto des runden Platzes im Empfangshof](https://en.wikipedia.org/wiki/Toshhovli_Palace#/media/File:KhivaTach_Khaouli_reception_yard_Iwan.JPG)
Wegen mehrerer harter Winter in jüngerer Zeit erlebt die Mongolei eine große Abwanderung aus den Steppen, weil die Viehherden stark geschrumpft sind, und die meisten Menschen strömen in die Städte. Selbst wenn sie wollten, gibt es nicht genug Platz in dauerhaften Gebäuden
Soweit ich gehört habe, besitzen viele ohnehin bereits ein Ger, und bei Bedarf lässt es sich vergleichsweise leicht verlegen. Ich habe zum Beispiel auch gehört, dass manche zu besonderen Anlässen wieder in ihr Haus auf dem Land zurückkehren
Ich neige eher zu der Deutung, dass das Leben im Ger nicht zwingend ein Zeichen gescheiterter öffentlicher Politik ist, sondern einfach eine kulturelle Entscheidung. Früher lebte auch Dschingis Khan im Ger, und tatsächlich wählen manche Menschen diese Lebensform aus Notwendigkeit, andere aus freiem Willen. Deshalb sollte man diese Erscheinung nicht pauschal negativ bewerten
In Ulaanbaatar gibt es standardisierte Gers. Auf großen Märkten kann man Teile oder komplette Gers leicht kaufen. 2017 kostete eines etwa 1.000 Dollar. Für dieses Geld bekommt man ein ordentlich isoliertes, leicht transportierbares kleines Haus, und in der Mongolei kann man sich damit außerhalb der Stadt praktisch überall niederlassen (wobei man bei 2.000 Schafen die Weidenutzung besser mit den Leuten vor Ort abstimmt). Die Entscheidung für ein Ger ist also nicht nur Tradition und Kultur, sondern in der jeweiligen Situation auch rational
Der Höflichkeit halber nennt man das türkische Wohnzelt „Jurte“ und die mongolische Variante „Ger“. In Frankreich heiße es scherzhaft „Shabadou“, in Kanada „Plumbus“ und in den USA „Flip“. Dazu der Witz, dass es einen schon etwas stört, wenn Einheimische den eigenen Shabadou einfach Ger nennen
Ich frage mich, welche Art von Fundamentarbeiten man zum Aufstellen eines Gers macht
Es wurde angemerkt, dass es in der Mongolei null Jurten gebe, auf die Machine Learning angewendet werde
Das kann ich mir kaum vorstellen; ich würde eher vermuten, dass es ziemlich viele sind
Zuerst dachte ich, Jurten seien ein Beruf oder ein Menschentyp, und habe den Titel deshalb falsch verstanden
Danke dafür, das war dank dir eine sehr lustige Erfahrung
Als Nicht-Muttersprachler frage ich mich, welcher Satz korrekter wäre. Genannt wurde auch eine Formulierung wie: „Ich habe mit Machine Learning alle Jurten der Mongolei gezählt“
Schade, dass die bereits in OpenStreetMap (OSM) eingezeichneten 89.259 Jurtenumrisse nicht als Input verwendet wurden. Allerdings hätte es wohl Probleme gegeben, diese Umrisse mit den Google-Maps-Bildern auszurichten
OSM-Statistik zu mongolischen Ger-Tags
Vermutlich hat das Modell Jurten an den Kachelgrenzen schlecht erkannt. Und gemessen an einer Bevölkerung von 3 Millionen wirkt die Zahl viel kleiner als erwartet
Zu dem Punkt „wenige Gers im Verhältnis zu 3 Millionen Menschen“: Wenn das tatsächliche Ergebnis 172.700 beträgt, man annimmt, dass jeweils eine Familie darin lebt, und 4 Personen pro Ger ansetzt (wahrscheinlich sind es in Wirklichkeit mehr), kommt man auf etwa 690.000 Menschen, also 20 % der 3,5 Millionen Einwohner der Mongolei. Das klingt ziemlich plausibel
Ich habe vor dem Klick auf den Link selbst grob geschätzt und teile die Zahl hier: Von 3 Millionen Einwohnern der Mongolei leben 1,5 Millionen in der Hauptstadt. Wenn man annimmt, dass etwa 1 Million außerhalb städtischer Zentren lebt, ergibt das bei 4 Personen pro Ger 250.000 Gers. Rechnet man Gäste-Gers, Lagerzwecke und Gers in Höfen noch dazu, käme man auf etwa 300.000, also fast doppelt so viel wie das Ergebnis der ML-App
Die Idee, OSM oder Ähnliches als Labels zu verwenden, kommt in Geo-/Machine-Learning-Projekten oft auf. Aber die Lizenz von OSM verbietet es, Google-Maps-Bilder zu übernehmen, daher gibt es selbst für Forschungszwecke viele rechtliche Probleme bei der Beschaffung oder Weiterverteilung der Bilder. Google sublizenziert IP aus verschiedenen externen Bildquellen und kontrolliert sie streng. Dazu kommt das Problem der Bild-/Label-Ausrichtung, und die Labels selbst können GPS-Koordinaten statt bildbasierter Annotationen sein. Bei mobilen Strukturen wie Gers ist die Vollständigkeit und Konsistenz der Labels ohnehin begrenzt. Auch die Vollständigkeit von OSM hängt stark von der Aktivität lokaler Communities ab. Trotzdem kann man es zur Kreuzvalidierung eigener Labels und Vorhersagen nutzen. Bei kachelbasierten Erkennungen verwirft man Vorhersagen an den Rändern meist und behandelt Duplikate mit überlappenden Fenstern und NMS
Auch 172.000 und ein paar Zerquetschte sind immer noch extrem viele, und gemessen an der Bevölkerung ist die Zahl der Gers dort wahrscheinlich höher als irgendwo sonst auf der Welt
Ich möchte betonen, dass das direkte Herunterladen von Google-Maps-Satellitenbildern laut Nutzungsbedingungen verboten ist. Tatsächlich wird man leicht gesperrt, deshalb überrascht es mich, dass jemand die Kacheln für die gesamte Mongolei bekommen hat
Abgesehen von Marktdominanz verstehe ich nicht, warum es solche Richtlinien gibt
Wenn man gesperrt wird, kann man ja einfach ein neues Konto anlegen, meint jemand
Das Ergebnis ist interessant, und ich frage mich, wie hoch die tatsächliche Falsch-Erkennungsrate war. Wurden Speichertanks, Silos oder Außenpools fälschlich als Gers klassifiziert?
Das erinnerte mich an Geo-/ML-Projekte aus meiner Uni-Zeit, daher war es eine große Freude, so etwas mal wieder zu sehen. Die australische Regierung steckt jedes Jahr viel Geld in ähnliche Arbeiten, aber verglichen mit den Ergebnissen des Autors wirkt unsere Regierung deutlich ineffizienter. Es ist frustrierend, dass man nicht einmal Landflächen sauber klassifizieren oder kleine gerförmige Objekte zuverlässig zählen kann
Bei dem Ergebnis „insgesamt 172.689 Gers mit einem Vorhersage-Score von über 40 % erkannt“ frage ich mich, wie man „prediction score“ hier interpretieren soll
Zuerst habe ich den Titel so missverstanden, als würden alle Jurten in der Mongolei Machine Learning „verwenden“
Es hieß, es sei eine halbkommerzielle Lösung (für Bildungszwecke kostenlos) verwendet worden, und ich bin neugierig auf die Topologie/Architektur des Deep-Learning-Modells. Mich interessiert auch, ob es bessere Ansätze gibt