29 Punkte von GN⁺ 2026-01-06 | 1 Kommentare | Auf WhatsApp teilen
  • 2025 war ein Jahr, das sich durch die wachsende Dominanz von PostgreSQL, die Verbreitung des MCP-Standards, große Übernahmen und Fusionen, eine neu entfachte Konkurrenz bei Dateiformaten und den Aufstieg von Larry Ellison zusammenfassen lässt
  • PostgreSQL etablierte sich als zentrales DBaaS der großen Cloud-Unternehmen, und verteilte Projekte (Multigres, Neki, PgDog) traten neu auf den Plan
  • Alle großen DBMS führten Anthropics Model Context Protocol (MCP) ein, womit die Integration von LLMs und Datenbanken ernsthaft Fahrt aufnahm
  • MongoDB reichte gegen FerretDB eine Klage im Zusammenhang mit API-Nachbildung ein, und im Bereich Dateiformate verschärfte sich der Wettbewerb um Parquet-Alternativen
  • Übernahmen, Schließungen und Finanzierungen prägten die Branche insgesamt, weshalb 2025 als Jahr gilt, in dem sich die Neuordnung und Konzentration der Datenbankindustrie beschleunigte

Anhaltende Expansion von PostgreSQL

  • PostgreSQL 18 wurde im November 2025 veröffentlicht und führte ein asynchrones I/O-Storage-Subsystem sowie die Funktion skip scan ein
    • Dadurch wird die Abhängigkeit vom OS-Seitencache reduziert und die Nutzung von Mehrschlüsselindizes verbessert
  • Databricks übernahm Neon für 1 Milliarde US-Dollar, Snowflake CrunchyData für 250 Millionen US-Dollar
    • Microsoft brachte HorizonDB auf den Markt, sodass nun alle großen Cloud-Anbieter einen PostgreSQL-basierten Dienst besitzen
  • Neue verteilte PostgreSQL-Projekte wie Supabases Multigres, PlanetScales Neki und PgDog erschienen
    • Supabase holte den Vitess-Mitgründer Sugu an Bord, um die Entwicklung einer Sharding-Middleware anzuführen
  • Als unabhängige PostgreSQL-Dienste waren unter anderem Supabase, YugabyteDB, TigerData, PlanetScale, Xata, PgEdge und Nile aktiv
    • Einige Startups wie Hydra und PostgresML stellten 2025 den Betrieb ein
  • Der auf PostgreSQL fokussierte Wettbewerb bei M&A und technologischer Weiterentwicklung wirkte als zentrale Triebkraft der Branche

MCP (Model Context Protocol) setzt sich flächendeckend durch

  • 2025 unterstützten alle großen DBMS den MCP-Standard von Anthropic
    • MCP ist eine JSON-RPC-basierte Schnittstelle, die es LLMs ermöglicht, mit Datenbanken zu interagieren
  • Nachdem OpenAI im März 2025 MCP-Unterstützung angekündigt hatte, veröffentlichten große Systeme wie ClickHouse, Snowflake, Oracle und MongoDB MCP-Server
    • Auch PostgreSQL-basierte Dienste boten jeweils eigene MCP-Server an, darunter Supabase, Timescale und Xata
  • MCP-Server greifen jeweils pro Einzelanfrage auf die Datenbank zu; Joins zwischen heterogenen Datenbanken werden nicht unterstützt
  • Neon übernahm mithilfe seiner Data-Branching-Funktion 80 % der von AI-Agenten erzeugten Datenbanken
  • Aus Sicherheitsgründen wurde die Notwendigkeit von Minimalprivilegien und automatischen Schutzmechanismen hervorgehoben
    • Einige Systeme bieten grundlegende Schutzfunktionen wie Read-only-Beschränkungen, Query-Timeouts und Ergebnislimits

Rechtlicher Streit zwischen MongoDB und FerretDB

  • MongoDB erhob 2025 gegen FerretDB Klage wegen Patent-, Urheberrechts- und Markenrechtsverletzung
    • FerretDB ist ein Middleware-Proxy, der MongoDB-Abfragen in PostgreSQL übersetzt; insbesondere die Verwendung des Ausdrucks „drop-in replacement“ wurde problematisiert
  • Microsoft spendete das MongoDB-kompatible Open-Source-Projekt DocumentDB an die Linux Foundation
    • Auch Amazon, Yugabyte und andere beteiligten sich an dem Projekt
  • Zur Behauptung MongoDBs, den „nichtrelationalen DB“-Bereich erschlossen zu haben, wurde darauf verwiesen, dass es bereits in den 1960er Jahren frühere Systeme wie IDS und IMS gab
  • Dass FerretDB anfangs den Namen „MangoDB“ trug, wurde im Zusammenhang mit einer Kontroverse um mögliche Markenverwechslung erwähnt

Neu entfachter Wettbewerb bei Dateiformaten

  • 2025 erschienen fünf neue Open-Source-Dateiformate, die die Dominanz von Parquet herausfordern
    • FastLanes (CWI), F3 (CMU + Tsinghua University), Vortex (SpiralDB), AnyBlox (deutsches Forschungsteam), Amudai (Microsoft)
  • Besonders beachtet wurde das von SpiralDB entwickelte Vortex, das an die Linux Foundation gespendet wurde; AnyBlox gewann den Best Paper Award der VLDB
  • Das Parquet-Entwicklerteam reagierte darauf mit einer Modernisierung der Spezifikation
  • Das unter Beteiligung von Pavlo entwickelte F3-Format soll mit einem integrierten WASM-basierten Decoder Interoperabilitätsprobleme lösen
  • Der nächste Wettbewerb dürfte sich mit hoher Wahrscheinlichkeit daran entscheiden, ob GPU-Unterstützung vorhanden ist

Trends bei Übernahmen, Investitionen und Schließungen

  • Wichtige Übernahmen im Jahr 2025
    • IBM übernahm DataStax und Confluent, Databricks kaufte Neon, Tecton und Mooncake
    • Snowflake übernahm CrunchyData und Datometry, Salesforce Informatica, Nvidia HeavyDB
    • Fivetran und dbt Labs fusionierten überraschend und formierten sich zu einer integrierten ETL-Plattform neu
  • Bedeutende Finanzierungsrunden
    • Databricks (4 Milliarden und 1 Milliarde US-Dollar), ClickHouse (350 Millionen US-Dollar), Supabase (200 Millionen und 100 Millionen US-Dollar), Timescale (110 Millionen US-Dollar) usw.
  • Beispiele für Schließungen
    • Fauna, PostgresML, Hydra, MyScaleDB, Voltron Data, Apache Derby und andere
    • Mit der Schließung des IBM Research Almaden Lab wurde ein symbolischer Endpunkt der DB-Forschung erwähnt
  • Pavlo wies auf die kommerziellen Grenzen GPU-basierter Datenbanken hin und betonte stattdessen die Reife CPU-basierter OLAP-Engines und den Wettbewerb über User Experience

Larry Ellisons „bestes Jahr“

  • 2025 stieg der Oracle-Gründer Larry Ellison zum reichsten Menschen der Welt (393 Milliarden US-Dollar) auf
    • Sein Vermögen wuchs stark durch den sprunghaften Anstieg der Oracle-Aktie und Investitionen in AI-Rechenzentren
  • Oracle war an großen Deals beteiligt, darunter die Übernahme des US-Geschäfts von TikTok und der Versuch von Paramount, Warner Bros zu übernehmen
  • Pavlo beschreibt Ellisons Kurs als „ein Symbol für eine Person, die die Welt mit Datenbanken erobert hat“
    • Trotz Kritik bleiben Oracles Einfluss und Ellisons Präsenz nach wie vor enorm

Fazit

  • Die Datenbankindustrie des Jahres 2025 lässt sich durch eine Neuordnung rund um PostgreSQL, die beschleunigte Integration von AI und LLMs sowie die Polarisierung durch große M&A-Deals und Schließungen zusammenfassen
  • Pavlo betont, dass sich sowohl Forschung als auch Branche auf Sicherheit, Standardisierung und Betriebsautomatisierung konzentrieren müssen
  • Abschließend kündigt er den Start des neuen Startups Sydht.ai aus dem Umfeld der CMU-Forschung an

1 Kommentare

 
GN⁺ 2026-01-06
Hacker-News-Kommentare
  • Man sollte sich unbedingt den besonderen Vortragsstil der CMU DB Group ansehen.
    Zu finden in den YouTube-Suchergebnissen.
    Besonders das Gangsta-Intro und das DJ-Set waren wirklich eindrucksvoll.
    Ich erinnere mich auch an ein älteres Video, in dem während der Vorlesung jemand auf dem Boden schlief. Dadurch wurde ich noch neugieriger auf Andys Werdegang und Hintergrund.

    • Wer Wu-Tang und Hip-Hop mag, wird das vermutlich nachvollziehen können. Das Intro war wirklich großartig.
    • Ich bin mir nicht sicher, ob CMUs „Intro to Database Systems“ auf Bachelor-Niveau ist oder eher ein fortgeschrittener Kurs über interne Strukturen. Als Datenbank-Anfänger suche ich einen passenden Einstiegskurs.
    • Ich habe dem Link „https://” hinzugefügt, damit er anklickbar ist.
  • Schade, dass in den Rückblicken der letzten Jahre immutable oder bi-temporale Datenbanken nicht erwähnt wurden.
    Solche DBs sind besonders in der Fintech-Branche sehr nützlich.
    Beispiele sind XTDB v2 (2025) und Datomic Free (2023).

    • An der CMU gab es vor 5 Wochen ein technisches Seminar zu XTDB.
      Ich frage mich, ob eine bloße Erwähnung nach dem Motto „existiert halt“ ausreicht.
    • Mit dem tstzrange-Typ von PostgreSQL und der Erweiterung pg_bitemporal kommt man ziemlich weit.
      Wir haben über ein Audit-Log-System auf Basis von Row Triggers Änderungshistorie und Undo-Funktionen umgesetzt.
      Außerdem verschieben wir die Logs in einen separaten Speicher und behalten so auch Offline-Backups.
    • Die Vorteile von Immutable DBs werden zunehmend erkannt. Es geht nicht nur um Auditing, sondern auch um gleichzeitiges Lesen, schnelle Replikation, Undo von Transaktionen und weitere Vorteile.
      Ich entwickle derzeit immutable SQLitexitdb-java.
    • Einige ergänzen Triple Stores um Zeitlichkeit und Unveränderlichkeit, weil xtdb oder datomic bei SPARQL-Graph-Traversals langsam sind.
      Ich hoffe auf einen Triple Store mit Time-Travel-Support.
    • Ich habe eine ähnliche Meinung auch in einem anderen Kommentar hinterlassen.
  • Die Datenbanktrends 2025 lassen sich auf zwei Punkte reduzieren:
    1️⃣ Alles auf SQLite umstellen
    2️⃣ JSON-Felder in den Mittelpunkt stellen
    SQLite ist dank seiner Ein-Datei-Struktur und dem daemonlosen Design leicht zu handhaben. Mit den JSON-Funktionen macht auch flexible Datenverarbeitung Spaß.

    • Aus meiner Sicht ist heute alles eher DuckDB. Single-File, Unterstützung für viele Formate, S3, Parquet, Column Store, WASM — einfach komplett.
    • Eigentlich frage ich mich eher: „Braucht man überhaupt zwingend eine DB?“ SQLite liegt irgendwo zwischen einer vollwertigen DB und einem selbstgebauten Object Store.
      Es bietet so etwas wie eine normalisierte Objektzugriffs-API.
    • SQLite ist zwar nicht für Multi-User-Umgebungen gedacht, aber wie weit kommt man, wenn mehrere Web-Verbindungen gleichzeitig schreiben?
    • Früher galt SQLite in Produktion als No-Go, aber das scheint sich inzwischen geändert zu haben.
    • Für mich ist die ideale Kombination: „wenn möglich SQLite, wenn nötig PostgreSQL, für Analytics DuckDB, für großes BI BigQuery“.
  • Ich verstehe, warum Pavlo bei MCP-Sicherheit skeptisch ist. MCP folgt einer Philosophie der Kontextfreigabe und läuft damit dem Prinzip der geringsten Privilegien zuwider.
    Wenn man eine DB über so ein Protokoll exponiert, sieht das Modell nicht nur einfache Daten, sondern auch die Komplexität des Schemas.
    Am Ende wirkt es wie eine Neuauflage von SQL Injection — nur dass diesmal keine böswilligen Nutzer, sondern Halluzinationen des Modells der Auslöser sind.

    • Ich habe die Statelessness von LLMs genutzt, um ein MCP-Gateway zu bauen, das die Herkunft des Eingabekontexts verfolgt und riskante Zustandsänderungen blockiert.
      Es basiert auf Simon Willisons Lethal-Trifecta-Framework und ist unter open-edison zu finden.
    • In Produktionsumgebungen wird niemand ein DB-MCP mit Schreibrechten einsetzen. Dafür dem Protokoll die Schuld zu geben, ist unfair.
    • Ich frage mich, ob der Nutzen wirklich groß genug war, um dafür Prinzipien aufzugeben. Wahrscheinlich ist es nur eine Fortsetzung der „move fast, break things“-Mentalität.
  • Ich habe das Gefühl, dass ein Wechsel zu Immutable DBs nötig ist.
    Datomic ist stark, aber komplex und mit steiler Lernkurve, und immudb ist noch nicht ausreichend produktionsreif.
    Schon ab einigen Hunderttausend Datensätzen treten Probleme auf.

  • Supabase wächst enorm. Ich habe sogar gehört, dass etwa 70 % der YC-Startups es nutzen.
    Ich frage mich, ob sie später zu self-hosted wechseln werden.

  • Es wurde erwähnt, warum EdgeDB in Gel umbenannt wurde, aber das hätte auch im Abschnitt zu Übernahmen ergänzt werden sollen.
    Gel ist zu Vercel gestoßen.

    • Danke. Ich habe im Blog einen Korrektur-Link ergänzt.
      Ich sollte einen Weg finden, solche Änderungen automatisch zu verfolgen.
    • Ehrlich gesagt bin ich enttäuscht. Selbst wenn man den offiziellen Beitrag von Vercel liest, wirkt die Zukunft von Gel unklar.
      Der letzte Commit auf GitHub ist auch schon 2 Wochen her.
  • Dank Andy und der DB Group an der CMU sind Datenbanken viel zugänglicher für die breite Masse geworden. Wirklich ein Team auf Weltklasseniveau.

    • Mich würde interessieren, was sie konkret getan haben.
  • Das Release von PostgreSQL 18 ist wirklich hervorragend.
    Die meisten sprechen nur über Async-IO-Worker, aber auch Unicode-Locale, unvalidierte Constraints hinzufügen, virtuelle Spalten, btree skip scan und UUIDv7 sind große Verbesserungen.

  • Der mehrjährige Trend der letzten Jahre ist beeindruckend.
    Databricks und Snowflake haben trotz des Cloud-Wettbewerbs Beweglichkeit und Überlebensfähigkeit bewiesen.
    Cloudera und Hortonworks dagegen sind gescheitert.
    Außerdem besetzt ClickHouse still und leise seine eigene Nische immer perfekter.