Datenbank-Rückblick 2025
(cs.cmu.edu)- 2025 war ein Jahr, das sich durch die wachsende Dominanz von PostgreSQL, die Verbreitung des MCP-Standards, große Übernahmen und Fusionen, eine neu entfachte Konkurrenz bei Dateiformaten und den Aufstieg von Larry Ellison zusammenfassen lässt
- PostgreSQL etablierte sich als zentrales DBaaS der großen Cloud-Unternehmen, und verteilte Projekte (Multigres, Neki, PgDog) traten neu auf den Plan
- Alle großen DBMS führten Anthropics Model Context Protocol (MCP) ein, womit die Integration von LLMs und Datenbanken ernsthaft Fahrt aufnahm
- MongoDB reichte gegen FerretDB eine Klage im Zusammenhang mit API-Nachbildung ein, und im Bereich Dateiformate verschärfte sich der Wettbewerb um Parquet-Alternativen
- Übernahmen, Schließungen und Finanzierungen prägten die Branche insgesamt, weshalb 2025 als Jahr gilt, in dem sich die Neuordnung und Konzentration der Datenbankindustrie beschleunigte
Anhaltende Expansion von PostgreSQL
- PostgreSQL 18 wurde im November 2025 veröffentlicht und führte ein asynchrones I/O-Storage-Subsystem sowie die Funktion skip scan ein
- Dadurch wird die Abhängigkeit vom OS-Seitencache reduziert und die Nutzung von Mehrschlüsselindizes verbessert
- Databricks übernahm Neon für 1 Milliarde US-Dollar, Snowflake CrunchyData für 250 Millionen US-Dollar
- Microsoft brachte HorizonDB auf den Markt, sodass nun alle großen Cloud-Anbieter einen PostgreSQL-basierten Dienst besitzen
- Neue verteilte PostgreSQL-Projekte wie Supabases Multigres, PlanetScales Neki und PgDog erschienen
- Supabase holte den Vitess-Mitgründer Sugu an Bord, um die Entwicklung einer Sharding-Middleware anzuführen
- Als unabhängige PostgreSQL-Dienste waren unter anderem Supabase, YugabyteDB, TigerData, PlanetScale, Xata, PgEdge und Nile aktiv
- Einige Startups wie Hydra und PostgresML stellten 2025 den Betrieb ein
- Der auf PostgreSQL fokussierte Wettbewerb bei M&A und technologischer Weiterentwicklung wirkte als zentrale Triebkraft der Branche
MCP (Model Context Protocol) setzt sich flächendeckend durch
- 2025 unterstützten alle großen DBMS den MCP-Standard von Anthropic
- MCP ist eine JSON-RPC-basierte Schnittstelle, die es LLMs ermöglicht, mit Datenbanken zu interagieren
- Nachdem OpenAI im März 2025 MCP-Unterstützung angekündigt hatte, veröffentlichten große Systeme wie ClickHouse, Snowflake, Oracle und MongoDB MCP-Server
- Auch PostgreSQL-basierte Dienste boten jeweils eigene MCP-Server an, darunter Supabase, Timescale und Xata
- MCP-Server greifen jeweils pro Einzelanfrage auf die Datenbank zu; Joins zwischen heterogenen Datenbanken werden nicht unterstützt
- Neon übernahm mithilfe seiner Data-Branching-Funktion 80 % der von AI-Agenten erzeugten Datenbanken
- Aus Sicherheitsgründen wurde die Notwendigkeit von Minimalprivilegien und automatischen Schutzmechanismen hervorgehoben
- Einige Systeme bieten grundlegende Schutzfunktionen wie Read-only-Beschränkungen, Query-Timeouts und Ergebnislimits
Rechtlicher Streit zwischen MongoDB und FerretDB
- MongoDB erhob 2025 gegen FerretDB Klage wegen Patent-, Urheberrechts- und Markenrechtsverletzung
- FerretDB ist ein Middleware-Proxy, der MongoDB-Abfragen in PostgreSQL übersetzt; insbesondere die Verwendung des Ausdrucks „drop-in replacement“ wurde problematisiert
- Microsoft spendete das MongoDB-kompatible Open-Source-Projekt DocumentDB an die Linux Foundation
- Auch Amazon, Yugabyte und andere beteiligten sich an dem Projekt
- Zur Behauptung MongoDBs, den „nichtrelationalen DB“-Bereich erschlossen zu haben, wurde darauf verwiesen, dass es bereits in den 1960er Jahren frühere Systeme wie IDS und IMS gab
- Dass FerretDB anfangs den Namen „MangoDB“ trug, wurde im Zusammenhang mit einer Kontroverse um mögliche Markenverwechslung erwähnt
Neu entfachter Wettbewerb bei Dateiformaten
- 2025 erschienen fünf neue Open-Source-Dateiformate, die die Dominanz von Parquet herausfordern
- FastLanes (CWI), F3 (CMU + Tsinghua University), Vortex (SpiralDB), AnyBlox (deutsches Forschungsteam), Amudai (Microsoft)
- Besonders beachtet wurde das von SpiralDB entwickelte Vortex, das an die Linux Foundation gespendet wurde; AnyBlox gewann den Best Paper Award der VLDB
- Das Parquet-Entwicklerteam reagierte darauf mit einer Modernisierung der Spezifikation
- Das unter Beteiligung von Pavlo entwickelte F3-Format soll mit einem integrierten WASM-basierten Decoder Interoperabilitätsprobleme lösen
- Der nächste Wettbewerb dürfte sich mit hoher Wahrscheinlichkeit daran entscheiden, ob GPU-Unterstützung vorhanden ist
Trends bei Übernahmen, Investitionen und Schließungen
- Wichtige Übernahmen im Jahr 2025
- IBM übernahm DataStax und Confluent, Databricks kaufte Neon, Tecton und Mooncake
- Snowflake übernahm CrunchyData und Datometry, Salesforce Informatica, Nvidia HeavyDB
- Fivetran und dbt Labs fusionierten überraschend und formierten sich zu einer integrierten ETL-Plattform neu
- Bedeutende Finanzierungsrunden
- Databricks (4 Milliarden und 1 Milliarde US-Dollar), ClickHouse (350 Millionen US-Dollar), Supabase (200 Millionen und 100 Millionen US-Dollar), Timescale (110 Millionen US-Dollar) usw.
- Beispiele für Schließungen
- Fauna, PostgresML, Hydra, MyScaleDB, Voltron Data, Apache Derby und andere
- Mit der Schließung des IBM Research Almaden Lab wurde ein symbolischer Endpunkt der DB-Forschung erwähnt
- Pavlo wies auf die kommerziellen Grenzen GPU-basierter Datenbanken hin und betonte stattdessen die Reife CPU-basierter OLAP-Engines und den Wettbewerb über User Experience
Larry Ellisons „bestes Jahr“
- 2025 stieg der Oracle-Gründer Larry Ellison zum reichsten Menschen der Welt (393 Milliarden US-Dollar) auf
- Sein Vermögen wuchs stark durch den sprunghaften Anstieg der Oracle-Aktie und Investitionen in AI-Rechenzentren
- Oracle war an großen Deals beteiligt, darunter die Übernahme des US-Geschäfts von TikTok und der Versuch von Paramount, Warner Bros zu übernehmen
- Pavlo beschreibt Ellisons Kurs als „ein Symbol für eine Person, die die Welt mit Datenbanken erobert hat“
- Trotz Kritik bleiben Oracles Einfluss und Ellisons Präsenz nach wie vor enorm
Fazit
- Die Datenbankindustrie des Jahres 2025 lässt sich durch eine Neuordnung rund um PostgreSQL, die beschleunigte Integration von AI und LLMs sowie die Polarisierung durch große M&A-Deals und Schließungen zusammenfassen
- Pavlo betont, dass sich sowohl Forschung als auch Branche auf Sicherheit, Standardisierung und Betriebsautomatisierung konzentrieren müssen
- Abschließend kündigt er den Start des neuen Startups Sydht.ai aus dem Umfeld der CMU-Forschung an
1 Kommentare
Hacker-News-Kommentare
Man sollte sich unbedingt den besonderen Vortragsstil der CMU DB Group ansehen.
Zu finden in den YouTube-Suchergebnissen.
Besonders das Gangsta-Intro und das DJ-Set waren wirklich eindrucksvoll.
Ich erinnere mich auch an ein älteres Video, in dem während der Vorlesung jemand auf dem Boden schlief. Dadurch wurde ich noch neugieriger auf Andys Werdegang und Hintergrund.
Schade, dass in den Rückblicken der letzten Jahre immutable oder bi-temporale Datenbanken nicht erwähnt wurden.
Solche DBs sind besonders in der Fintech-Branche sehr nützlich.
Beispiele sind XTDB v2 (2025) und Datomic Free (2023).
Ich frage mich, ob eine bloße Erwähnung nach dem Motto „existiert halt“ ausreicht.
Wir haben über ein Audit-Log-System auf Basis von Row Triggers Änderungshistorie und Undo-Funktionen umgesetzt.
Außerdem verschieben wir die Logs in einen separaten Speicher und behalten so auch Offline-Backups.
Ich entwickle derzeit immutable SQLite — xitdb-java.
Ich hoffe auf einen Triple Store mit Time-Travel-Support.
Die Datenbanktrends 2025 lassen sich auf zwei Punkte reduzieren:
1️⃣ Alles auf SQLite umstellen
2️⃣ JSON-Felder in den Mittelpunkt stellen
SQLite ist dank seiner Ein-Datei-Struktur und dem daemonlosen Design leicht zu handhaben. Mit den JSON-Funktionen macht auch flexible Datenverarbeitung Spaß.
Es bietet so etwas wie eine normalisierte Objektzugriffs-API.
Ich verstehe, warum Pavlo bei MCP-Sicherheit skeptisch ist. MCP folgt einer Philosophie der Kontextfreigabe und läuft damit dem Prinzip der geringsten Privilegien zuwider.
Wenn man eine DB über so ein Protokoll exponiert, sieht das Modell nicht nur einfache Daten, sondern auch die Komplexität des Schemas.
Am Ende wirkt es wie eine Neuauflage von SQL Injection — nur dass diesmal keine böswilligen Nutzer, sondern Halluzinationen des Modells der Auslöser sind.
Es basiert auf Simon Willisons Lethal-Trifecta-Framework und ist unter open-edison zu finden.
Ich habe das Gefühl, dass ein Wechsel zu Immutable DBs nötig ist.
Datomic ist stark, aber komplex und mit steiler Lernkurve, und immudb ist noch nicht ausreichend produktionsreif.
Schon ab einigen Hunderttausend Datensätzen treten Probleme auf.
Supabase wächst enorm. Ich habe sogar gehört, dass etwa 70 % der YC-Startups es nutzen.
Ich frage mich, ob sie später zu self-hosted wechseln werden.
Es wurde erwähnt, warum EdgeDB in Gel umbenannt wurde, aber das hätte auch im Abschnitt zu Übernahmen ergänzt werden sollen.
Gel ist zu Vercel gestoßen.
Ich sollte einen Weg finden, solche Änderungen automatisch zu verfolgen.
Der letzte Commit auf GitHub ist auch schon 2 Wochen her.
Dank Andy und der DB Group an der CMU sind Datenbanken viel zugänglicher für die breite Masse geworden. Wirklich ein Team auf Weltklasseniveau.
Das Release von PostgreSQL 18 ist wirklich hervorragend.
Die meisten sprechen nur über Async-IO-Worker, aber auch Unicode-Locale, unvalidierte Constraints hinzufügen, virtuelle Spalten, btree skip scan und UUIDv7 sind große Verbesserungen.
Der mehrjährige Trend der letzten Jahre ist beeindruckend.
Databricks und Snowflake haben trotz des Cloud-Wettbewerbs Beweglichkeit und Überlebensfähigkeit bewiesen.
Cloudera und Hortonworks dagegen sind gescheitert.
Außerdem besetzt ClickHouse still und leise seine eigene Nische immer perfekter.