3 Punkte von GN⁺ 2023-10-05 | 1 Kommentare | Auf WhatsApp teilen
  • Der Text behandelt die Graph Mining Library, ein Projekt, das von Google Graph Mining entwickelte Tools umfasst.
  • Diese Tools wurden dafür konzipiert, Data-Mining- und Machine-Learning-Probleme zu lösen, die entweder von Natur aus eine Graphstruktur besitzen oder sich als Graphprobleme formalisieren lassen.
  • Die Bibliothek enthält Parallel-Clustering-Algorithmen für Shared-Memory-Systeme, die Graphen mit Milliarden von Kanten verarbeiten können.
  • Diese Algorithmen basieren auf mehreren Forschungsarbeiten, darunter "Hierarchical Agglomerative Graph Clustering in Poly-Logarithmic Depth", "Scalable community detection via parallel correlation clustering", "Affinity Clustering: Hierarchical Clustering at Scale" und "Distributed Balanced Partitioning via Linear Embedding".
  • Es werden Links zu bestimmten Abschnitten des Repositories bereitgestellt, die mit den jeweiligen Arbeiten zusammenhängen.
  • Bei Fragen oder Anmerkungen wird Nutzern empfohlen, im Repository ein Issue zu erstellen.
  • Der Text bietet außerdem eine Schnellstartanleitung zur Installation von Bazel und zum Ausführen von Beispielen.

1 Kommentare

 
GN⁺ 2023-10-05
Hacker-News-Kommentare
  • Mit dem Aufstieg sozialer Netzwerke wurde Graph Mining vor etwa zehn Jahren populär.
  • Es war populär, bis geometrisches Lernen, eine Form des Machine Learning auf Graphen und anderen Strukturen, sowie auch Latent-Dirichlet-Allocation-Modelle (LMMs) breitere Verbreitung fanden.
  • Das Datenbanksystem Arangodb umfasst Integrationen mit verschiedenen Graph-Bibliotheken und Machine-Learning-Frameworks wie NetworkX, DeepGraphLibrary, cuGraph und PyG.
  • Es gibt eine Frage dazu, wie die Bibliothek mit Bazel aufgebaut wird, einem Tool zur Automatisierung von Software-Builds und -Tests.
  • Die Bibliothek könnte mit Wrappern oder Erweiterungsbibliotheken integriert werden, um graphbasierte Clustering-Algorithmen einzubinden.
  • Es gibt eine Frage zur Beziehung zwischen Pregel, einem System zur Verarbeitung großer Graphen, und der Bibliothek.
  • Es wird um eine Erklärung zu potenziellen Anwendungsfällen und Beispielen für den Einsatz der Bibliothek gebeten.
  • Die Bibliothek ist in C, C++ und Starland geschrieben, und es gibt eine Frage dazu, was Starland ist.
  • Ähnlich wie bei Basic Linear Algebra Subprograms (BLAS) und Linear Algebra Package (LAPACK) gibt es Stimmen, die eine Standardisierung von Graph-Algorithmen fordern.
  • Einige hofften, dass die Bibliothek für statistisches Graph Mining zur Anomalieerkennung verwendet werden könnte.