Falsche TCP-Annahmen, an die Programmierer glauben

(lwn.net)

3 Punkte von GN⁺ 2024-09-16 | Noch keine Kommentare. | Auf WhatsApp teilen

So wie NetworkManager kurze Verbindungsinstabilitäten als „kein Netzwerk“ einstuft, vertrauen manche Softwarekomponenten ihrer eigenen Zustandsbeurteilung mehr als der TCP-Wiederherstellung – in realen Netzwerken kann das jedoch gefährlich sein
Der Glaube, dass „gesendete Daten ankommen“, „beide Seiten sich am Ende über die übertragenen Bytes einigen“ oder man dies mit Anwendungsprotokollen wie HTTP oder SMTP garantieren könne, bricht in manchen Situationen zusammen
Wird die Verbindung während der ACK-Verarbeitung unterbrochen, kann der Sender nicht wissen, ob das Segment angekommen ist; diese Grenze lässt sich wie beim Two Generals’ Problem nicht mit einem einzelnen TCP-Stream zwischen zwei Parteien lösen
Auch SMTP behandelt dieses Problem in RFC 1047 und RFC 2821; an dem Punkt, an dem die Zustellverantwortung übergeht, gibt es bei Verbindungsfehlern eine mehrdeutige Phase, in der doppelte Zustellung oder Auslassungen entstehen können
Wer seltsame Netzwerke als Ausnahme abtut oder Details wie den Nagle-Algorithmus, Congestion Control oder das Blockieren von ICMP ignoriert, interpretiert echte Störungen leicht falsch

Das Problem, den Netzwerkzustand vor TCP vorschnell festzulegen

Ein Nutzer von NetworkManager erlebte früher in Wohnheim- und Campus-Roaming-Umgebungen instabile WLAN-Verbindungen und stellte fest, dass schon geringe Paketverluste dazu führten, dass dem ganzen System „kein Netzwerk“ gemeldet wurde
Dabei konnte das Netzwerk kurz darauf bereits wieder verfügbar sein, und eine normale TCP-Wiederherstellung konnte – selbst mit stark erhöhter Latenz – für Anwendungen weitgehend transparent bleiben
Das Beispiel zeigt das Problem, dass Anwendungen oder Systemkomponenten vorübergehende Störungen, die TCP selbst behandeln könnte, zu schnell als Fehler interpretieren

Die vorigen Punkte 1 bis 4 zur TCP-Zuverlässigkeit hängen mit dem Two Generals’ Problem zusammen
Wenn die Verbindung unterbrochen wird, während ein ACK noch verarbeitet wird, hat der Sender keine Möglichkeit festzustellen, ob das betreffende Segment empfangen wurde
Diese Grenze verschwindet nicht, auch wenn man über TCP noch komplexere Schichten stapelt
Auf einem einzelnen TCP-Stream zwischen zwei Parteien lässt sich diese Garantie nicht herstellen; dafür braucht es ein Verfahren ähnlich Paxos oder Raft sowie mindestens drei Knoten
Dieselbe Art von Problem betrifft nicht nur TCP, sondern auch Dienste zwischen zwei Parteien auf Basis von UDP oder IP

Bei SMTP tritt dieses Problem besonders deutlich zutage, weil der Dienst explizit berücksichtigen muss, ob beide Seiten den Nachrichtenerhalt anerkennen
RFC 1047 behandelt das Problem aus SMTP-Sicht, und RFC 2821 schreibt vor, dass Implementierungen dem Kernratschlag aus RFC 1047 folgen sollen
Im SMTP-Beispiel werden die folgenden Zustände unterschieden
- Man kann einen Punkt erreichen, an dem beide Seiten sich einig sind, dass die E-Mail vom Client an den Server übertragen wurde
- Man kann auch einen Punkt erreichen, an dem beide Seiten sich einig sind, dass der Server die Verantwortung für die Zustellung der E-Mail übernommen hat
- Davor muss jedoch zwingend ein mehrdeutiger Zustand durchlaufen werden, in dem unklar ist, wer gerade die Zustellverantwortung trägt
Wird die Verbindung in diesem mehrdeutigen Zustand unterbrochen, kann die E-Mail dupliziert werden oder verloren gehen
Die SMTP-Spezifikation legt fest, welche Seite im Zweifel eine E-Mail duplizieren soll, aber wie gut das in realen Implementierungen getestet wurde, ist unklar
Das Ziel von Paxos und Raft besteht nicht nur darin, einen Endzustand zu erreichen, sondern gerade darin, solche mehrdeutigen Zustände zu vermeiden

Ein Kommentar meint, dass sich zwei Parteien selbst über einen unzuverlässigen, aber nicht bösartigen Link auf eine bestimmte Menge von Bytes einigen können, für die gilt: „Sie wurden zugestellt, und beide wissen das“
In der ergänzenden Diskussion wird präzisiert, dass eine Partei zwar wissen kann, dass mindestens die ersten N Bytes zur vereinbarten Menge gehören, aber nicht, dass die vereinbarte Menge genau aus den ersten N Bytes besteht
Deshalb kann es zwar eine Menge von Bytes geben, für die „sicher zugestellt und von beiden Seiten als zugestellt bekannt“ gilt, doch dahinter bleibt eine Grauzone, in der Sender und Empfänger den Wissensstand der Gegenseite nicht sicher festlegen können
Wer diesen Unterschied übersieht, stößt in verteilten Systemen leicht auf seltsame Fehler

Der Glaube, man könne „seltsame Netzwerke, die für Standardprotokolle nicht transparent sind, ignorieren“, hat wiederholt Probleme verursacht
Bufferbloat wird als Beispiel dafür genannt, dass Router Mechanismen der Congestion Control aushebeln können
Problematisch können auch Netzwerke sein, die ICMP blockieren oder Datenverkehr verwerfen, den sie nicht verstehen
Auch der Glaube, man müsse „über Congestion Control nichts wissen“, ist eher ein Beispiel für ein falsches Verständnis von TCP
- Ein Unterbeispiel dafür ist die Vorstellung, man müsse bei zu geringer Geschwindigkeit einfach mehrere TCP-Verbindungen öffnen