- Das von Web-Erfinder Tim Berners-Lee vorgeschlagene Konzept der nutzerzentrierten Datenspeicherung wird Realität
- Sein früher Entwurf, das Solid-Protokoll, zielt auf eine Struktur, in der Einzelpersonen ihre Daten direkt besitzen und Anwendungen mit Erlaubnis der Nutzer darauf zugreifen
- In jüngster Zeit entwickelt sich auch Blueskys AT-Protokoll in dieselbe Richtung und setzt ein dezentralisiertes soziales Web um, in dem Daten auf persönlichen Servern (PDS) gespeichert werden
- Diese persönliche Datenspeicherung geht über die technische Umsetzung hinaus und erweitert sich zu Strukturen, die Bürger in Form von Datengenossenschaften (Data Co-ops) besitzen und betreiben
- Letztlich ist dies eine Bewegung, die das Web wieder zum Raum des Einzelnen macht, und kann als Versuch verstanden werden, die plattformabhängige Struktur des Internets grundlegend neu zu gestalten
Tim Berners-Lees Vision: Socially Aware Cloud Storage
- Das 2009 von Berners-Lee vorgeschlagene „Socially Aware Cloud Storage“ ist eine Web-Spezifikation, die so entworfen wurde, dass Anwendungen auf einer unabhängigen Speicherschicht arbeiten
- Nutzer werden über globale Identifikatoren auf URI-Basis verwaltet, und die Zugriffskontrolle erfolgt in standardisierter Form
- Datenspeicher werden von Anwendungen getrennt und als allgemeine, austauschbare Ressource definiert
Entstehung und Entwicklung des Solid-Protokolls
- 2015 sicherte sich Tim Berners-Lee die Finanzierung für die Entwicklung des Solid-Protokolls und betrieb dazu Forschung am MIT
- Ziel von Solid ist der Aufbau einer Web-Architektur, die die Datenhoheit an die Nutzer zurückgibt und einen freien Wechsel zwischen Apps ermöglicht
- Nutzer verwalten ihre Daten an einem Ort, und Apps müssen diese mit Zustimmung der Nutzer anfragen
- Solid entwickelte sich zu einer offiziellen W3C-Web-Spezifikation, hat aber noch keine breite Akzeptanz erreicht
- Das von Berners-Lee mitgegründete Unternehmen Inrupt treibt die Kommerzialisierung vor allem im Unternehmensmarkt voran
AT-Protokoll und Personal Data Server (PDS)
- Das vom Bluesky-Team entwickelte AT-Protokoll (Atproto) ist derzeit ein offenes soziales Netzwerk mit mehr als 30 Millionen Nutzern
- Anders als Solid ist die technische Struktur zwar unterschiedlich, doch die Philosophie der nutzersouveränen Datenspeicherung ist dieselbe
- Im AT-Protokoll werden persönliche Daten auf einem Personal Data Server (PDS) gespeichert, was dem „Pod“-Konzept von Solid ähnelt
- Nutzer können ihre eigene Domain als Internet-Handle verwenden und so eine unabhängige Identität über soziale Netzwerke hinweg bewahren
- Beispiel: eine Struktur, in der eine persönliche Domain wie
@alice.com als Handle genutzt wird
Der Aufstieg der Datengenossenschaften (Data Co-ops)
- Die meisten gewöhnlichen Nutzer bevorzugen nach wie vor cloudbasierte institutionelle Speicherung statt eines persönlichen PCs
- Diskutiert wird ein Übergang zu einer Struktur aus gemeinschaftlich besessenen Datenbanken, ähnlich dem Kreditgenossenschaftsmodell traditioneller Banken
- Dabei wird das Modell der Credit Union auf Daten übertragen; im Mittelpunkt stehen transparente, mitgliederorientierte Verwaltung und Kontrolle
- Tatsächlich werden genossenschaftliche Datenplattformen wie
social.coop, data.coop und cosocial.ca im Fediverse-Ökosystem bereits aktiv betrieben
- Das neue Projekt Northsky wird ebenfalls als gemeinsame Dateninstitution auf Basis des AT-Netzwerks vorbereitet
- Solche Organisationen müssen rechtlich keine Genossenschaften sein, sondern umfassen alle Formen, die demokratische und transparente Datenverwaltung leisten
Ein neues Paradigma der Datensouveränität
- Wenn Daten in Institutionen gespeichert werden, die von Bürgern statt von Unternehmen kontrolliert werden, verschiebt sich der Fokus der Debatte über Datenbesitz
- Nicht mehr „Welche Daten können wir herunterladen?“, sondern „Welche Daten kann eine Plattform von unserem Server kopieren?“
- Auch der technische Austausch zwischen Solid und AT nimmt zu, und die Diskussion über Interoperabilität mit Standards wie ActivityPub wird intensiv geführt
- Persönliche Datenspeicherung hat sich inzwischen zu einem Konzept entwickelt, das über einzelne Protokolle hinausgeht; Datenformate sind konvertierbar, und Protokolle gegenseitig austauschbar
- Im Kern geht es darum, dass Menschen durch die Kontrolle über ihre eigenen Daten die Freiheit gewinnen, ihre digitale Identität selbst nach dem Zusammenbruch einer Plattform wiederherzustellen
Fazit: Das Web wieder zum Raum des Einzelnen machen
- Persönliche Datenspeicherung ist keine Technologie, sondern eine Rückkehr zu einer Philosophie des Internets
- Weg vom plattformzentrierten Web, hin zu einer Struktur, in der Einzelpersonen und Communities Daten direkt besitzen und betreiben
- Die verschiedenen Ansätze von Solid, AT und ActivityPub laufen alle auf dasselbe Ziel hinaus — das Web wieder den Menschen selbst zurückzugeben
Weiterführende Links
1 Kommentare
Hacker-News-Kommentare
Ich arbeite an einem FOSS-Projekt namens Blobcache mit
https://github.com/blobcache/blobcache
Für mich ist es ein grundlegender Unterschied, ob ein Server den Anwendungszustand speichert oder ob er Änderungsrechte bzw. Leserechte für diese Daten hat
In Zukunft sollten Server meiner Meinung nach nur noch meine Daten sicher aufbewahren, während die Clients intelligenter werden
Ich möchte beim Nutzen einer App einen E2E-verschlüsselten Zustand vom Server abrufen, ihn verändern und die neu verschlüsselten Daten wieder auf dem Server speichern
Der Server sollte ausschließlich für die Haltbarkeit der Daten verantwortlich sein, und man müsste ihm nicht einmal vertrauen, dass er diese Rolle wirklich gut erfüllt
Blobcache stellt eine API bereit, mit der ein „dummer“ Speicher-Server und „smarte“ Clients im E2EE-Zustand Transaktionen durchführen können
Man kann Blobcache und ein VPN wie Tailscale auf alter Hardware installieren und so Daten von anderen Geräten leicht übertragen
Die Einrichtung ist ähnlich wie bei SSH: Man fügt einfach Schlüssel zur Konfigurationsdatei hinzu und erhält damit Zugriffsrechte
Die meisten Unannehmlichkeiten bei der Nutzung von Storage verschwinden dadurch
Ich baue mit Blobcache ein Git-artiges E2EE-Versionierungstool für das Home-Verzeichnis des ganzen Hauses
https://github.com/gotvc/got
Die Art, wie Apps in Peergos E2EE-Daten verwenden, ist Blobcache sehr ähnlich
Es wäre schön, dabei zusammenzuarbeiten, deshalb würde ich gern Kontakt aufnehmen
https://peergos.org/posts/a-better-web
Erwähnenswert ist auch https://remotestorage.io/ als nutzerbezogener Storage
So wie ich das gelesen habe, bestehen solche Vorschläge den evolutionären Test nicht
Um eine Idee in großem Maßstab umzusetzen, muss man die aktuelle Situation schrittweise verbessern, statt ein fernes Zielbild zu zeichnen
Der heutige Zustand liegt bereits ziemlich nahe an einem hohen lokalen Maximum, und Leute, die neue Formen der Informationskontrolle propagieren, haben bislang nur Ansätze präsentiert, die viel Kosten oder Aufwand verursachen
Man muss nicht den ganzen Weg kennen, aber zumindest die ersten ein oder zwei Schritte sollten besser sein als die aktuelle Lage
Wenn man am Ende fliegen will, muss man eben zuerst Federn evolvieren lassen
Realistisch entwicklungsfähig erscheint mir folgender Weg
Für frühe Händler sinkt damit der Aufwand für die Speicherung von PCI/PII, was einen Anreiz zur Einführung schafft
Jeder einzelne Schritt fühlt sich besser an als das heutige System
Ich stimme zu, dass wir keine große Veränderung auf einmal brauchen, sondern in jedem Schritt spürbare Verbesserungen
Aber würde ein normaler Nutzer allein dadurch, dass er „seine Daten besitzt“, wirklich eine bessere UX empfinden?
Wenn es mit weniger Werbung und Produkten kombiniert wird, die den Nutzer an erste Stelle setzen, könnte es funktionieren
Es gibt viele Aufgaben, die zwar nicht viel Geld kosten, aber dennoch erledigt werden müssen, und das macht mir Sorgen, trotzdem bleibe ich optimistisch
Derzeit nutzen 99,9 % der BlueSky-Nutzer nur den BlueSky-Dienst, aber BlueSky hat für jeden Nutzer einen Personal Data Service (PDS)
Man kann seine Daten jederzeit aus BlueSky herausziehen und woanders hin umziehen, und seit Kurzem auch wieder zurück zu BlueSky
Im eigenen PDS lassen sich beliebige Daten speichern, etwa Git-Daten von https://tangled.org, Musik-Hörverläufe von https://teal.fm oder Blogs von https://leaflet.pub
Fälle von selbst betriebenen PDS oder Community-Hosting nehmen rasch zu
Auch Relay-Server zur Aggregation und Verknüpfung von PDS-Daten entwickeln sich weiter; eine Aggregationsschicht zu betreiben, die vollständige Netzwerkanbindung bietet, ist zwar schwieriger, wird aber schrittweise besser
Verglichen mit bestehenden Strukturen ist das eindeutig innovativ, und die Begeisterung der Entwickler ist deutlich sichtbar und verleiht dem Ganzen große Kraft
Durch die Trennung der Architektur sind Fortschritte in vielen Bereichen möglich, und das Fundament ist so solide, dass die Skalierbarkeit hoch ist
Es fühlt sich an, als würden evolutionäre Experimente tatsächlich stattfinden, und das ist sehr spannend
Ich mag das Konzept persönlicher Datenspeicherung wirklich sehr und wünschte, es wäre der Standard
Aber es gibt ein Problem, das technisch womöglich gar nicht lösbar ist
In diesem Artikel wird zum Beispiel kein „Schema“ erwähnt, dabei ist genau das ein großer Hemmschuh für echte Datenportabilität
Ich habe selbst erlebt, wie schwierig es schon in einfachen CRUD-Apps ist, Feldformate zu ändern
Man kann seine Daten zwar aus Google oder Facebook exportieren, aber sie so darzustellen und zu nutzen wie in der ursprünglichen App, ist fast so schwer wie die komplette Original-UI nachzubauen; und wenn sich das Schema des Ursprungsdienstes ändert, entstehen Rendering- und Integrationsprobleme oder sogar Datenverlust
In unabhängigen Datensilos kann man Formate frei ändern, aber wenn mehrere Speicherorte ihre Datenschemata unabhängig voneinander verändern, wird Synchronisation am Ende fast unmöglich und das Risiko von Datenverlust steigt stark
Außerdem sind Berechtigungen und Identitätsprüfung pro Schema ein ziemlicher Albtraum
Zum Beispiel muss man A vielleicht auf bestimmte Felder beschränken, aber bei der Synchronisation über mehrere Server hinweg wissen manche Server nicht, wer userA ist, sodass die Daten behandelt werden, als existierten sie gar nicht
Vertrauen, Identität und Audit-Prozesse machen fein granularen Zugriff in verteilten Systemen wirklich schwierig
Wenn man sich die aktuellen Top-Posts auf Hacker News ansieht, kreisen viele um Ideen wie „Lasst uns das Web zurückholen“ oder „Lasst uns Self-Hosting, Föderation und Ähnliches wie in den 90ern wiederbeleben“
In der Realität scheint sich nichts zu ändern und alles eher schlimmer zu werden, und es kommen immer neue Generationen nach, die das Gefühl des Internets der 90er oder der Zeit vor mobilen Geräten gar nicht kennen
Wenn man heute irgendwo etwas beantragt, entstehen nur nutzlose Kopien persönlicher Daten in zahllosen Datenbanken auf der ganzen Welt, die später gehackt, missbraucht, verkauft oder vergessen werden
Ich weiß nicht einmal, ob es dafür eine Lösung gibt, und manchmal fühlt es sich an, als wäre es einfacher, die Erde in die andere Richtung zu drehen
In Europa ist dieses Datenschutzproblem praktisch fast gelöst
Gesetze haben tatsächliche Wirkung, deshalb können echte Unternehmen Daten nicht einfach illegal speichern oder verkaufen
Aber viele Leute sehen nur die oberflächlichen Dinge wie Cookie-Banner und bemerken die eigentlichen Erfolge nicht richtig
Tatsächlich treibt Europa Veränderungen in der digitalen Welt voran, die die Lebensqualität der Bürger verbessern
Ein Beispiel dafür sind sofortige Banküberweisungen ohne Gebühren als öffentliches Gut
Wenn sogar wir, die eine andere Zeit noch selbst erlebt haben, aus dem Grund aufgeben, dass „sich ohnehin nichts ändert“, dann wird sich wirklich nichts ändern
Tatsächlich war es noch nie so einfach und unkompliziert wie heute, Open-Source- und Self-Hosting-Alternativen aufzubauen
Die charakteristischen Menschen aus dem Internet der 90er sind immer noch da und sind weiterhin auf die alte Art online aktiv
Das heutige Internet ist nur deshalb viel einfacher und zugänglicher geworden, weil es von vielen normalen Menschen genutzt werden kann, die darin weder Spaß noch Magie sehen
Die Haltung, die heutige Online-Welt immer nur pauschal schlechtzureden, ist bedauerlich, weil sie die noch vorhandenen wertvollen Dienste und Communities abwertet
Die bestehenden Dienste sind vielleicht weder elegant noch cool, aber sie existieren weiterhin und erfüllen nach wie vor ihren Zweck
Auf die Frage, wie man mit der hemmungslosen Vervielfältigung, Vernachlässigung, dem Hacken und Verkaufen persönlicher Daten umgehen soll, denke ich, dass Daten erst dann besser behandelt werden, wenn sie für ihre Besitzer als „gefährliche Verbindlichkeit“ gelten
Damit sich die Haltung zum Datenmanagement wirklich ändert, müssten Fälle wie „Megabank geht nach Datenleck bankrott, Führungskräfte verhaftet“ alltäglich werden
Solange es nur nach dem Muster „Schon wieder ein Datenleck, diesmal gibt’s LifeLock gratis!“ weiterläuft, wird sich die Wahrnehmung kaum ändern
Der genannte Fall ist nicht bloß Fantasie, denn Netzwerke wie Bluesky und AT-net laufen tatsächlich und haben bereits reale Auswirkungen, weshalb sie von mehreren autoritären Staaten bedroht werden
Die überzeugendste und plausibelste Lösung für dieses Problem ist meiner Ansicht nach der Standard Solid, geschaffen von Tim Berners Lee, dem Erfinder des Webs
[https://en.wikipedia.org/wiki/Solid_(web_decentralization_project)](https://en.wikipedia.org/wiki/Solid_(web_decentralization_pr...)
Das verleiht ihm aus meiner Sicht mehr als genug Legitimität, die Datenstruktur des Internets zu verändern, und auch die Solid-Technologie selbst ist ziemlich robust
Schade ist nur, dass Solid sich nicht breiter durchgesetzt hat
Wahrscheinlich liegt das daran, dass das bestehende Web zu groß ist und die meisten existierenden Tech-Stacks nicht auf „echtes Dateneigentum“ ausgelegt sind
Man tauscht nicht einfach ein paar Bibliotheken aus, sondern muss Entwicklung und Datenverarbeitung grundsätzlich neu denken, was die Einführung erschwert
Das Solid-Team versteht diese Probleme sehr gut und hat gute Werkzeuge und Bibliotheken entwickelt, damit die Einführung in neuen Projekten nach und nach einfacher wird
Deshalb setze ich große Hoffnung in die Zukunft und Skalierbarkeit von Solid
Der Behauptung „Statt über viele Unternehmen und Websites verteilt zu sein, liegen meine Daten an einem Ort unter meiner Kontrolle“ stimme ich nicht zu
In der Realität kann eine Website, sobald ich dort Daten hochlade, sie beliebig kopieren und verkaufen, und es gibt kaum eine wirksame Möglichkeit, das zu verhindern
Am Ende werden also nur Datenportabilität und Interoperabilität geschaffen und die Verantwortung für Blockieren und Spam-Management von den Websites auf die Nutzer verlagert
Das Grundproblem von Privatsphäre und „ich bestimme selbst, mit wem ich meine Informationen teile“ scheint damit nicht gelöst
Selbst wenn ich meine Daten nur SiteA und nicht dem Datensammler B gebe, gibt es keinen Grund, warum A sie nicht an B weiterverkaufen sollte
Praktisch ist das also überhaupt nicht anders als heute
Wenn man Daten wirklich nur an einem Ort behalten will, dürfte man sie mit externen Websites oder Diensten überhaupt nicht teilen, aber das ist realistisch unmöglich
Man kann es zwar nicht verhindern, aber was Dritte erhalten, ist zumindest nur eine „Kopie“
Das Eigentum an meinen Daten bleibt weiterhin bei mir, und Zugriff, Freigabe, Backup und Analyse an einer zentralen Stelle werden einfacher
Es hilft enorm dabei, Daten aus dem Lock-in zu befreien
Es ist auch nicht völlig unmöglich festzustellen, ob ein Dritter meine Daten verkauft hat, und dagegen zu klagen; außerdem würde die Nicht-Exklusivität von Datenformaten verpflichtend
Das fühlt sich deutlich besser an als das heutige System
Wenn ich den Ursprung und das Eigentum an meinen Daten eindeutig geltend machen kann, sollte ich auch ihren Weiterverkauf untersagen können
In der EU gibt es tatsächlich das Recht, von Unternehmen die „Löschung personenbezogener Daten“ zu verlangen
Solche Rechte lassen sich leichter durchsetzen, je klarer definiert ist, dass die Daten „mir gehören“
Aktuelle Daten sind viel wertvoller als alte Daten
Ich kann selbst verwalten, wem ich welche Daten zu welchem Zweck bereitstelle, und bei Bedarf Zugriffsrechte ein- und ausschalten
Der Weiterverkauf von Daten sollte grundsätzlich als illegal gelten
So wie es selbstverständlich ist, dass ein Anwalt oder Arzt meine Informationen nicht verkaufen darf, sollte dasselbe Recht für jeden gelten, der persönliche Daten verarbeitet
Der Wunsch, alles selbst zu hosten, existiert schon lange
Aber Unternehmen haben Zentralisierung vorangetrieben, weil sie einfacher ist und sich die Daten dort zusätzlich monetarisieren lassen
Tatsächlich ist es viel einfacher, große Dienste wie Facebook, instagram oder gmail zu nutzen, als selbst zu hosten, und weil alle dort sind, ist es bequem, auch selbst dort zu bleiben
Es gibt bisher noch nicht genug wirklich zugängliche dezentrale Lösungen für normale Nutzer, und auch die Anreize sind schwach
Wenn dieses Zugänglichkeitsproblem nicht grundlegend gelöst wird, dürfte sich der Trend kaum ändern
Durch meine Erfahrungen mit Plex habe ich den Eindruck, dass Menschen viel stärker selbst hosten wollen, als wir oft annehmen, auch wenn sie diesen Wunsch schwer klar formulieren können
Plex ist keine vollständig selbst gehostete Lösung, aber es ist Netflix deutlich näher als klassische Dienste, und in letzter Zeit versuchen immer mehr Menschen ohne besonders hohe IT-Kompetenz, selbst einen Plex-Server einzurichten
Oft geht es dabei nicht einfach darum, kostenlos Filme zu schauen, sondern um die eigenen Kinder
Wenn man Inhalte selbst kuratiert, hat man mehr Kontrolle darüber, was das Kind sieht, und das gibt deutlich mehr Sicherheit
Es erinnert an das beruhigende Gefühl von früher, wenn Eltern die TV-Kanäle einschränkten
Viele Eltern empfinden das heutige Internet als zu chaotisch und voller Risiken und möchten wenigstens ein Stück Kontrolle wieder in die eigene Hand nehmen
Ich hoffe, dass sich solche Gedanken irgendwann zu einer nützlicheren Bewegung weiterentwickeln können
Es freut mich, dass Opera Unite erwähnt wurde
Das war eine revolutionäre Idee: Jeder konnte ohne besonderes Wissen allein mit dem Browser ganz einfach eine kleine statische Website erstellen
Wäre das erfolgreich geworden und hätte sich eine Kultur etabliert, in der Menschen ihre Inhalte selbstbestimmt teilen, hätten wir heute wahrscheinlich ein viel gesünderes Internet statt sozialer Netzwerke voller Kommerzialisierung und Manipulation
Das Konzept eines PDS (Personal Data Service) gefällt mir sehr
Ich denke aber, die Community sollte Problemen wie Content-Farmen, Spam und der klaren Zuordnung ursprünglicher Quellen eine höhere Priorität geben
Ohne solche Schutzmechanismen können böswillige Akteure föderierte Strukturen leicht zum Kollabieren bringen
Schon das E-Mail-Netzwerk (SMTP) zeigt, wie ernst dieses Problem ist
Vertikal integrierte Apps sind im Betrieb viel günstiger
Instagram speichert nur einen Teil der Fotos, ist aber dennoch hochprofitabel
Kontodienste wie iCloud haben dagegen kaum Web-APIs und sind faktisch auf Apple-Geräte beschränkt, trotzdem zahlen die Leute bereitwillig dafür, wenn auch nur, um nicht ein größeres iPhone kaufen zu müssen
Dass es trotzdem nicht viele Apps gibt, die unabhängig auf einem Web-Dateisystem laufen, hat folgende Gründe
Universelle Lösungen sind in der Praxis oft extrem langsam oder wegen Geschwindigkeits- und Kostenproblemen kaum alltagstauglich
Wenn man ohnehin schon doppelt für Storage zahlt, sind nur sehr wenige Nutzer bereit, zusätzlich auch noch Bandbreitenkosten zu tragen
Der Aussage „Wenn Daten nicht bei Unternehmen, sondern in menschenzentrierten Organisationen gespeichert werden, verändert sich die Debatte über Dateneigentum“ kann ich schwer zustimmen
Unternehmen sind ebenfalls Organisationen, die von Menschen geführt werden
Sie werden über Aktionäre und Vorstände kontrolliert, nicht von Außerirdischen, und auch das System bewegt sich nicht von selbst
Gemeint war vermutlich eher eine Ablehnung gewinnorientierter Firmen, bei denen Kunden nicht direkt über den Betrieb abstimmen können
Das Wort „Unternehmen“ wird oft fast wie ein Synonym für eine böse Macht verwendet, dabei ist es letztlich nur eine Organisation im Besitz einiger weniger konkreter Menschen
Und wenn man als Beispiel „@alice.com“ verwendet, ist es ironischerweise auch noch eine .com-Domain, also etwas, das den kommerziellen Bereich repräsentiert
https://en.wikipedia.org/wiki/Institution#Examples
https://en.wikipedia.org/wiki/.com
Selbst nichtkommerzielle Websites probieren oft zuerst eine .com-Adresse