1 Punkte von GN⁺ 2024-11-14 | 1 Kommentare | Auf WhatsApp teilen

Visualisierung von 13 Millionen BlueSky-Nutzern

  • Vergleich zwischen Twitter und BlueSky

    • Twitter ist eine große Plattform mit einer gewaltigen Nutzerbasis und vielen unterschiedlichen Bereichen.
    • BlueSky hat in den letzten Monaten ein starkes Wachstum seiner Nutzerbasis verzeichnet, insbesondere durch die anhaltende Feindseligkeit gegenüber der Twitter-Nutzerbasis und das Twitter-Verbot in Brasilien.
    • Mit den Daten von BlueSky lässt sich das gesamte Netzwerk visualisieren.
  • Datenerfassung

    • BlueSky basiert auf dem AT-Protokoll und wurde so konzipiert, dass Daten über Personal Data Server (PDS) selbst gehostet werden können.
    • Im Projekt werden Ereignisse in Echtzeit über den WebSocket von bsky.network gesammelt und in einer SQLite-Datenbank gespeichert.
  • Graph-Rendering

    • Einen Graphen mit 13 Millionen Knoten und 500 Millionen Kanten zu rendern, ist eine komplexe Aufgabe.
    • Zur Visualisierung wird ein Force-Directed-Layout-Algorithmus verwendet, der einer physikalischen Simulation ähnelt.
    • Zur Verringerung der Rechenkomplexität wird die Barnes-Hut-Optimierung eingesetzt.
  • Andromeda-Engine

    • Eine in Zig entwickelte Multithread-Engine, die mit GTK4 und OpenGL eine GUI erstellt.
    • Inspiriert von Gephi und dem ForceAtlas2-Paper, mit Fokus auf Interaktivität für die Visualisierung großer Graphen.
  • Dimensionsreduktion mit UMAP

    • UMAP ist einer der Algorithmen mit sehr guter Leistung für 2D-Visualisierungen.
    • Durch Node Embeddings als Eingabe für UMAP wird eine bessere Visualisierung erzielt.
    • Im letzten Schritt von UMAP wird ein Force-Directed-Graph verwendet, um die Abstände zwischen den Knoten anzupassen.
  • Farben hinzufügen

    • Auf die UMAP-Ausgabe wird ein Clustering-Algorithmus angewendet, um Farben hinzuzufügen.
    • Mit k-Means-Clustering wird jedem Cluster ein Farbton zugewiesen, und die Helligkeit jedes Knotens wird anhand seiner Follower-Zahl angepasst.
  • Ergebnisse und künftige Pläne

    • Die Visualisierung zeigt Dichte und Struktur großer Cluster klar.
    • Als künftige Funktion ist geplant, eine Seitenleiste hinzuzufügen, die die Timeline der aktuell auf dem Bildschirm sichtbaren Accounts anzeigt.

1 Kommentare

 
GN⁺ 2024-11-14
Hacker-News-Kommentare
  • Das BSKY-Feed wurde nicht aktiv genutzt, wodurch das Interesse nachließ. Im Vergleich zu Twitter in der Anfangszeit sollte ein neues soziales Netzwerk lebendig sein
  • Bluesky und atproto wurden so entworfen, dass man daran hacken kann. In der Community wurde ein durchsuchbares Verzeichnis der Bluesky-„Starter Packs“ aufgebaut
    • Dan Abramov lobte dieses Projekt und erwähnte, dass soziale Unternehmen durch das Schließen ihrer APIs das öffentliche Web eingeschränkt hätten
  • Bluesky wächst in bestimmten Bereichen rasant. Da Gespräche auf Twitter an Wert verloren haben, sind Nutzer zu Bluesky gewechselt, und die Aktivität hat zuletzt zugenommen
  • Es wird erwartet, dass Bluesky zu einer linken Version von „Truth Social“ wird. Ein Wandel zu einer globalen Marke dürfte schwierig sein
  • Die BlueSky-API wird als hervorragend bewertet. Ein Kollege hat darauf basierend eine Visualisierung erstellt
  • Als Nutzer, der zu Bluesky gewechselt ist, zeigt man sich zufrieden. Bluesky ähnelt Twitter im Jahr 2015, aber ohne Werbung oder Growth Hacking
  • Die Visualisierung von Bluesky wird als effektiv bei der Informationsvermittlung und visuell ansprechend bewertet
  • Es ist positiv, dass man für Bluesky-Benutzernamen Domains verwenden kann. Verifizierung erhält dadurch mehr Bedeutung
  • BlueSky befindet sich derzeit in einem positiven Zustand, und es wird empfohlen, einen Account einzurichten
  • Die BlueSky-Matrix kann nicht direkt in UMAP eingespeist werden, aber mit anderen Techniken lassen sich User-Embeddings ableiten