Der seltsamste Bug, den ich bisher gesehen habe
(engineering.gusto.com)Entdeckung und Behebung eines seltsamen Bugs
- Während des On-Call-Dienstes des internen Tool-Teams kam es bei Nutzern der internen Software von Gusto zu Browser-Abstürzen in Chrome.
- Das Problem verursachte vielfältige Störungen im Kundenservice.
- Zur Lösung des Problems wurde die Hilfe erfahrener Kollegen, des Produktinfrastruktur-Teams und des IT-Teams hinzugezogen.
Der erste Hinweis
- Es wurde versucht, Gemeinsamkeiten unter den betroffenen Nutzern zu finden.
- Nicht alle Gusto-Mitarbeitenden waren betroffen, und die kundenseitige Software funktionierte ohne Probleme.
- Andere Webseiten der internen Software funktionierten normal.
- Die Abstürze traten uneinheitlich auf, und in Safari oder Firefox trat das Problem nicht auf.
Der zweite Hinweis
- Es wurde die Hypothese aufgestellt, dass die Chrome-Version das Problem sein könnte.
- Bei einigen Nutzern schien das Problem nach einem Update ihrer Chrome-Version behoben zu sein, vollständig gelöst war es jedoch nicht.
- Es wurde vermutet, dass eine Chrome-Erweiterung die Ursache sein könnte, doch das Problem ließ sich auch ohne Erweiterungen reproduzieren.
Schwierigkeiten bei der Reproduktion des Bugs
- Das Infrastruktur-Team bat alle Engineers, das Problem zu reproduzieren.
- Mit Ausnahme von zwei Engineers in der Türkei meldete niemand aus dem Engineering-Team Abstürze.
- Die Chrome-Absturzberichtsfunktion war aus Sicherheitsgründen deaktiviert, was die Fehlersuche erschwerte.
Eine glückliche Wendung
- Ein Engineer in Denver meldete, dass das Problem auftrat, nachdem er die Desktop-App von Grammarly heruntergeladen hatte.
- Es wurde festgestellt, dass das Problem verschwand, wenn die Grammarly-App gelöscht und der Computer neu gestartet wurde.
Fortschritt
- Nachdem Debugging möglich geworden war, wurden verschiedene Versuche unternommen, um die Ursache des Problems zu finden.
- Die wichtigste interne Anwendung war auf ActiveAdmin aufgebaut, doch neuere Bereiche mit React stürzten nicht ab.
- Bei der Untersuchung gemeinsamer Codebestandteile wurde festgestellt, dass das Dropdown-Menü „My History“ die Ursache des Problems war.
Problemlösung
- Es wurde bestätigt, dass die Bilddatei
loader-spinner.gifdas Problem verursachte. - Nachdem dieses GIF durch ein anderes Bild ersetzt worden war, stürzte die Seite nicht mehr ab.
- Ob Grammarly oder Chrome das Problem inzwischen behoben hat, ist unklar; jedenfalls bringt das ursprüngliche GIF Chrome nun nicht mehr zum Absturz.
Fazit
- Ein unerwartetes animiertes GIF war der Schlüssel zur Fehlersuche.
- Das Problem wurde durch Neugier und Zusammenarbeit gelöst.
- Gusto bietet die Möglichkeit, mit kooperativen und neugierigen Menschen zusammenzuarbeiten.
Meinung von GN⁺
Das Wichtigste an diesem Artikel ist die detaillierte Beschreibung, wie ein Bug mit einer unerwarteten Ursache entdeckt und behoben wurde. Der Text zeigt die Komplexität und Unvorhersehbarkeit des Software-Engineerings und betont, wie wichtig Teamwork und beharrliche Problemlösung sind. Er bietet ein spannendes Beispiel dafür, wie ein Engineering-Team gemeinsam ein rätselhaftes Problem löst, und dürfte für Menschen mit Interesse am Engineering ein äußerst ansprechender Beitrag sein.
1 Kommentare
Hacker-News-Kommentare
Erstaunen und Zweifel über einen Bug, der durch eine bestimmte GIF-Datei ausgelöst wird
Problem mit dem Drucken von Unterstreichungen bei der Arbeit an einer wissenschaftlichen Publikation eines Universitätsprofessors
Geteilte Erfahrung mit einem Grammarly-bezogenen Bug
Enttäuschung über die Behebung des Bugs
Audioproblem beim Dual-Boot von Windows und Linux
Interesse an Bugs in der Web-Umgebung des Jahres 2023
Geteilte Erfahrung mit einem Bug im Zusammenhang mit den Barrierefreiheits-Tools von Chrome
Geteilte Verwirrung durch die Seitentranslations-Einstellung
Geteilte Erfahrung mit einem Absturz des Linux-Desktops durch das CSS einer Website
Meinung, dass die Behebung des Bugs eine wichtige Sicherheitslücke sein könnte