Vector - Open-Source-Plattform für hochperformante Observability-Datenpipelines

xguru · 2024-03-19T10:16:01+09:00

Eine hochperformante End-to-End-Observability-Datenpipeline-Plattform, mit der Nutzer ihre Observability-Daten kontrollieren können (Agent und Aggregator) Sammelt, transformiert und routet Logs und Metriken, sodass sie an jeden Anbieter gesendet werden können, den man heute nutzen möchte, sowie an andere Anbieter, die man künftig vielleicht nutzen will Senkt Kosten, bietet neue Datenanreicherung (Enrichment) und Datensicherheit, ist Open Source und laut eigener Aussage bis zu 10-mal schneller als andere Alternativen Prinzipien Zuverlässigkeit - In Rust entwickelt, wobei Zuverlässigkeit ein zentrales Designziel ist End-to-end - Bereitstellung als Agent oder Aggregator. Vector ist eine vollständige Plattform Integration - Logs, Metriken (Beta), Traces (demnächst verfügbar). Ein Tool für alle Daten Anwendungsfälle Senkung der gesamten Observability-Kosten Anbieter wechseln, ohne Workflows zu beeinträchtigen Datenqualität verbessern und bessere Insights gewinnen Agenten konsolidieren und Agent Fatigue beseitigen Gesamtleistung und Zuverlässigkeit der Observability verbessern Community Startups und Großunternehmen wie Atlassian, T-Mobile, Comcast, Zendesk, Discord, Fastly, CVS, Trivago, Tuple, Douban, Visa, Mambu, Blockfi, Claranet und Instacart verlassen sich auf Vector Vector wird täglich mehr als 100.000 Mal heruntergeladen Der größte Nutzer von Vector verarbeitet täglich mehr als 30 TB an Daten Vector hat mehr als 100 Mitwirkende und wächst weiter

(github.com/vectordotdev)

13 Punkte von xguru 2024-03-19 | 2 Kommentare | Auf WhatsApp teilen

Eine hochperformante End-to-End-Observability-Datenpipeline-Plattform, mit der Nutzer ihre Observability-Daten kontrollieren können (Agent und Aggregator)
Sammelt, transformiert und routet Logs und Metriken, sodass sie an jeden Anbieter gesendet werden können, den man heute nutzen möchte, sowie an andere Anbieter, die man künftig vielleicht nutzen will
Senkt Kosten, bietet neue Datenanreicherung (Enrichment) und Datensicherheit, ist Open Source und laut eigener Aussage bis zu 10-mal schneller als andere Alternativen

Prinzipien

Zuverlässigkeit - In Rust entwickelt, wobei Zuverlässigkeit ein zentrales Designziel ist
End-to-end - Bereitstellung als Agent oder Aggregator. Vector ist eine vollständige Plattform
Integration - Logs, Metriken (Beta), Traces (demnächst verfügbar). Ein Tool für alle Daten

Anwendungsfälle

Senkung der gesamten Observability-Kosten
Anbieter wechseln, ohne Workflows zu beeinträchtigen
Datenqualität verbessern und bessere Insights gewinnen
Agenten konsolidieren und Agent Fatigue beseitigen
Gesamtleistung und Zuverlässigkeit der Observability verbessern

Community

Startups und Großunternehmen wie Atlassian, T-Mobile, Comcast, Zendesk, Discord, Fastly, CVS, Trivago, Tuple, Douban, Visa, Mambu, Blockfi, Claranet und Instacart verlassen sich auf Vector
Vector wird täglich mehr als 100.000 Mal heruntergeladen
Der größte Nutzer von Vector verarbeitet täglich mehr als 30 TB an Daten
Vector hat mehr als 100 Mitwirkende und wächst weiter

2 Kommentare

softer 2025-02-14

Wächter der Log-Pipeline

xguru 2024-03-19

Hacker-News-Kommentare

Positive Einschätzung der Vector-Software
- Vector ist hervorragende Software für den Betrieb von Log-Pipelines mit mehreren GB/s.
- Der Vector-Agent sammelt als DaemonSet Pod- und journald-Logs und sendet sie über das protobuf-Protokoll von Vector an einen zentralen Vector-Aggregator (Deployment).
- Es unterstützt verschiedene Speicherziele (s3, gcs/bigquery, loki, prom).
- Die Dokumentation ist gut, aber Beispiele für allgemeine Muster sind möglicherweise schwer zu finden; mit der Zeit und einer wachsenden Nutzerbasis wird das jedoch besser.
- Ein nützlicher Tipp ist, bei Google nach "vector dev" zu suchen, um gute Ergebnisse zu erhalten.
- Kürzlich wurde außerdem ein Beitrag hinzugefügt, der Counter besser verarbeitet und als Alternative zu Prometheus pushgateway dient.
Vision und Erwartungen an ein Log-Speichersystem
- Ein System zur Log-Verarbeitung und -Speicherung ist fast fertig und soll sich mittel- bis langfristig zu einem abfragbaren Log-Speichersystem weiterentwickeln.
- Logs werden mit Tools wie Vector verarbeitet und in breit verstandenen Dateiformaten im Objektspeicher abgelegt.
- Log-Objekte werden in einem Metadaten-Store registriert und sind dadurch durchsuchbar.
- Tools wie Delta Lake oder Iceberg können sowohl in großen als auch in kleinen Umgebungen funktionieren.
- Mehrere Log-Verarbeitungs-Pipelines können in dasselbe Repository committen.
- Leistungsstarke Tools wie Clickhouse, DuckDB und Spark können diese Daten lesen.
- Durch die Verwendung von Standardformaten ist es möglich, Tools zu wechseln oder mehrere Tools gleichzeitig zu nutzen.
Zuverlässigkeit und Nützlichkeit von Vector
- Vector ist deutlich zuverlässiger als beats oder anbieterspezifische Forwarder (chronicle forwarder, fdr).
- VRL ist nützlich, um große Logs wie aws cloudtrail und imperva abp „vorzuparsen“.
Erfahrungen mit Vector und Empfehlung
- Es gibt praktische Erfahrung mit Vector; die Konfiguration ist einfach und die Sprache vrl ist leistungsfähig genug.
- Die "check"-Funktion der CLI hilft dabei, Konfigurationsprobleme zu erkennen.
- Es gibt keine Leistungsprobleme, und es wird wegen seiner Ressourceneffizienz empfohlen.
Die Vielseitigkeit von Vector
- Vector ist mehr als nur „hochperformant“; es ist wie ein Schweizer Taschenmesser für Logs und Metriken.
- Es wird für viele Aufgaben genutzt, etwa um Logs in Metriken umzuwandeln, Metriken in andere Formate zu konvertieren, Daten in andere Datenspeicher zu pushen oder zu filtern.
- Es ist die erste Wahl zum Sammeln, Aggregieren, Filtern und Vorverarbeiten von Observability-Daten.
Interesse an Vector und Erwartungen
- Jemand hat erst nach dem Einrichten einer neuen fluent-bit-Pipeline von Vector erfahren.
- Vector hat viele interessante Funktionen, und man würde es gern so bald wie möglich ausprobieren, wenn Zeit dafür ist.
- Es dürfte spannend sein, es in einem neuen Projekt zu testen.
Einsatzbereich und Möglichkeiten von Vector
- Was man über Vector gesehen hat, bestand größtenteils aus Beispielen und Diskussionen, die sich auf Datenbanken oder komplexe Multi-Tenant-Anwendungen bezogen.
- Es wird gefragt, ob jemand Vector in verteilten Systemen wie autonomen Fahrzeugen eingesetzt hat, um Betriebslogs, Systemzustand sowie Ein- und Ausgaben jeder Anwendung zu aggregieren.
Praktische Anwendungsfälle und weitere Nutzungsmöglichkeiten von Vector
- Vector wird für den Log-Transport genutzt und ersetzt dabei eine logstash-Konfiguration, die die benötigten Aufgaben nicht erfüllen konnte.
- Man hat die Möglichkeiten von Vector erst ansatzweise erkannt und möchte es noch viel stärker nutzen.
- Es wird nach Informationen zu Einsatzfällen von Vector jenseits des Log-Transports gesucht.
Vertrauensproblem bei Datadog
- Es besteht Misstrauen gegenüber der Tatsache, dass Datadog Vector verwaltet, das als Konkurrent zu OTEL erscheint.
Funktionen von Vector und weitere Beobachtungspläne
- Vector ist interessant, kann aber derzeit nicht eingesetzt werden, weil Tracing fehlt.
- Es ist geplant, Vector in den kommenden Monaten weiter zu beobachten, in der Erwartung, dass noch brauchbare Funktionen hinzukommen.