- ChatGPT Atlas ist ein neuer KI-basierter Webbrowser, in dem ChatGPT im Mittelpunkt steht, mit dem Ziel, den Nutzerkontext, Tools und Aufgaben zu verbinden und einen „Super-Assistenten“ zu schaffen
- Atlas unterstützt Nutzerinnen und Nutzer dabei, beim Durchsuchen des Webs im Kontext zu arbeiten: ChatGPT begleitet sie und ermöglicht die Bearbeitung von Aufgaben ohne Verlassen der Seite sowie Kontextverständnis
- Über den Browser-Speicher merkt sich Atlas den Kontext der besuchten Sites und unterstützt bei der Beantwortung von Fragen, Zusammenfassungen oder Terminplanung
- Mit dem Agent Mode kann ChatGPT im Browsing-Umfeld echte Aktionen wie Tabs öffnen, Informationen suchen, Reservierungen vornehmen und Bestellungen aufgeben ausführen
- Für macOS wurde Atlas weltweit veröffentlicht; in Zukunft folgen Versionen für Windows, iOS und Android, womit es als neuer Meilenstein für KI-basiertes Browsing gilt
- ChatGPT Atlas ist ein Tool, das ChatGPT und einen Webbrowser als KI-basierten Webbrowser kombiniert
- Es geht über reine Suche hinaus und zielt auf eine intelligente Browser-Umgebung ab, die den Nutzerkontext versteht und handelt
- Nachdem die ChatGPT-Websuche bisher schnell Verbreitung gefunden hat, hat OpenAI den Browser selbst als KI-zentrierte Plattform neu aufgebaut, um Arbeitsautomatisierung, Forschung und Terminplanung zu unterstützen
- Nutzer können ohne manuelles Kopieren und Einfügen direkt im Atlas-Fenster mit ChatGPT arbeiten
Browser-Speicher-Funktion
- Atlas speichert einen Browser-Speicher auf Basis der von Nutzerinnen und Nutzern besuchten Websites, um kontextbasierte Gespräche und personalisierte Unterstützung bereitzustellen
- Beispiel: Automatische Verarbeitung von Anfragen wie „Fass die Stellenanzeige zusammen, die ich letzte Woche gesehen habe“
- Der Speicher wird unter vollständiger Nutzerkontrolle verwaltet; Nutzer können ihn jederzeit anzeigen, speichern und löschen
- Wenn der Browserverlauf gelöscht wird, werden damit verbundene Speicherinhalte ebenfalls gelöscht, und die Reichweite des Speichers kann auf Website-Ebene angepasst werden
- Standardmäßig werden Browser-Inhalte nicht für das Modelltraining verwendet und nur bei explizitem Opt-in zum Trainingsdatensatz hinzugefügt
Agent Mode (Agentenmodus)
- Der integrierte Agent Mode von Atlas ist die Funktion, mit der ChatGPT reale Aufgaben direkt im Browser des Nutzers ausführt
- Beispiel: Zutaten auf Basis eines Rezepts in den Warenkorb legen und bestellen oder Dokumente lesen und eine Wettbewerbsanalyse durchführen
- Der Agent öffnet und klickt auf Tabs und führt Aufgaben nur nach ausdrücklicher Zustimmung aus
- Plus-, Pro- und Business-Kunden erhalten den Vorschaumodus; Geschwindigkeit und Zuverlässigkeit werden kontinuierlich verbessert
Sicherheit und Datenschutz
- Atlas setzt auf Sicherheitsprinzipien an erster Stelle und nutzt diese Einschränkungen
- Keine Codeausführung im Browser, kein Dateidownload, keine Installation von Erweiterungen
- Kein Zugriff auf lokale Dateien oder andere Apps
- Auf sensiblen Seiten wie Finanzinstituten erfolgt automatisch eine kurze Unterbrechung
- Der Agent bleibt auch im Abmelde-Modus nutzbar, um das Risiko personenbezogener Offenlegung zu senken
- Für den Schutz vor bösartigen Seiten und Befehlsangriffen in versteckten E-Mail-Inhalten wurden tausende Stunden Red-Team-Tests durchgeführt, ergänzt durch ein schnelles Patching-System gegen neue Angriffstypen
- Nutzer wird empfohlen, bei Atlas die ausgeführten Aufgaben zu überwachen und den Abmelde-Modus zu nutzen
Daten- und Steuerungseinstellungen
- Nutzer können die Site Visibility für ChatGPT über einen Schalter in der Adressleiste kontrollieren
- Bei Deaktivierung wird der Zugriff auf Seiteninhalte blockiert und die Speichererstellung gestoppt
- Wer Trainingsdaten einschließen möchte, kann dies über die Option „include web browsing“ in den Einstellungen aktivieren
- Die Elternkontrolle wurde ebenfalls verstärkt: Eltern können den Browser-Speicher oder den Agent-Modus deaktivieren
Unterstützte Plattformen und Ausrollung
- ChatGPT Atlas ist sofort für macOS verfügbar; für Free-, Plus-, Pro- und Go-Nutzer einsetzbar
- Auch Nutzer von Business-, Enterprise- und Edu-Plänen können es nutzen, wenn der Admin es aktiviert
- Versionen für Windows, iOS und Android erscheinen in Kürze
- Nutzer können Lesezeichen, Passwörter und den Verlauf aus bestehenden Browsern übernehmen und einfach wechseln
Zukunftspläne
- OpenAI plant als nächste Schritte die Unterstützung für mehrere Profile, Verbesserungen bei den Entwicklerwerkzeugen sowie die Erweiterbarkeit durch Apps SDK-Integration
- Website-Betreiber können die Arbeit des ChatGPT-Agenten auf ihren Seiten verbessern, indem sie ARIA-Tags hinzufügen
- Diese Einführung gilt als erster Schritt dafür, KI direkt im Browser zu etablieren und eine „konversationelle Web-Erfahrung“ zu realisieren
1 Kommentare
Hacker News Kommentar
Ich finde es zu engstirnig, sich nur auf Datenschutz zu fokussieren. Wichtiger ist, ob diese Technologie das bestehende Internet-Browsing grundlegend verändern kann und wie stark sie die Monetarisierung von Web-Traffic beeinflusst. Besonders der Unterschied ist groß, ob es sich um echte V0.1- oder bereits V1.0-Erfahrungen handelt. Wenn es V1.0 wäre, könnte der Wechsel vom traditionellen Web schnell ablaufen und ökonomisch erhebliche Auswirkungen haben; dann ist der Ausbau von KI-Investitionen in Rechenzentren auch gut zu rechtfertigen.
Ich habe die wichtigsten Bildschirme des ChatGPT-Atlas-DMG-Installers zusammengefasst (Installations-Screenshot):
Die Antwort von OpenAI wirkt ähnlich wie Comet von Perplexity, und ich frage mich, ob das zur Zukunft wird. Solche KI-Browser haben durchaus großen Nutzen, aber ich habe das Gefühl, dass letztlich ein einziger Big Tech entsteht, der alles kontrolliert. Ich hoffe, dass Open-Source-Browser wie Firefox bald eigene LLM-Funktionen als Alternativen anbieten. Eine on-device-Verarbeitung statt cloudbasierter LLMs wäre ideal, aber das Problem ist: Fast alle guten ML-Ingenieur*innen sind bereits zu Big Tech gegangen.
Ich habe den Agent-Modus von Atlas getestet. Basierend auf meinen Erfahrungen und Interessen zeigte er mir HN-Kommentare, zu denen ich inhaltlich etwas beitragen könnte: sieben zu Startup/Cloud, die ich gut kenne, und drei zu etwas weniger bekannten (Fine-tuning von LLMs). Die vorgeschlagenen Kommentare trafen den Kern dessen, was ich sagen würde, aber es fühlte sich wie ein Stilbruch zwischen dem, was ich schreiben würde, und dem Output an. Ich frage mich danach, ob ich mit so einem Tool Tätigkeiten, die ich sonst gern mache, in seelenlose Arbeit verwandeln würde. Das Tool ist interessant, aber ich weiß noch nicht sicher, wofür ich es nutzen würde.
Ich frage mich, warum Atlas nur auf macOS unterstützt wird; mit Linux- oder Windows-Support wäre es eher wie ein echter Launch gewirkt.
Ich sehe zwar einen klaren Einsatzbereich, aber ich habe ein starkes Gefühl, dass ich mein ganzes Alltagsleben dem KI-Unternehmen überlasse. Wenn ich etwas wissen möchte, öffne ich lieber einfach die ChatGPT-App und frage direkt. Für mich ist es eher in der gleichen Kategorie wie die Honey-Browser-Extension, nur dass das Datenschutz-Problem hier deutlich schwerwiegender ist; dass Daten wirklich privat bleiben, glaube ich keine Sekunde.
Atlas basiert offensichtlich auf Chromium, aber ich sehe nirgendwo einen Verweis auf Chromium, keine Lizenzangabe, kein Credit. Sogar die chrome://-Seiten sind blockiert. In einem Open-Source-Projekt sollte man die Grundlage und Herkunft mindestens transparent benennen; selbst wenn es am Anfang holprig ist, gehört das zu den Basics. Oder ist das der Standard, oder bin nur ich der Komische?
atlas://creditsverwiesen, aber es gibt keinen offiziellen Zugriffspfad oder eine sichtbare Einblendung dafür.OpenAI scheint die Nischen abzudecken, die Apple Intelligence nicht schafft. Lieber wäre mir, wenn solche Funktionen als macOS-Standardfunktion kämen, möglichst mit FoundationLLM-Local-Processing für maximale Privatsphäre und nur bei wirklich nötig erforderlichen Frontier-Modellaufrufen über eigene Server. Apple muss KI-Assistenten im OS deutlich tiefer integrieren. Apple Intelligence hat zwar einen guten Start, aber bei wirklich wichtigen Funktionen habe ich das Gefühl, dass die wirklich entscheidenden Komponenten aus dem Stack „versteckt“ sind.
Ich nutze keine LLM-Chrome-Plugins, weil ich bei übermäßiger Datenerfassung in Browsern kein Vertrauen habe. Auch hier ist die gleiche Sorge da, diesmal eben bei einem Konzern mit besserem Vertrauensimage. Ich weiß selbst nicht, ob das hier besser ist.
Wenn diese Technik nützlich aussieht, sollte man sich überlegen, wie sehr autoritäre Regime danach gierig wären. Wenn Werbung schon mal einen „Schauer" auslöst, dann ist Atlas ein root-Level-Keylogger-Dienst. Warum sollte ich einer KI-Firma erlauben, all meine Browser-Interaktionen zu sammeln und zu protokollieren? Google macht mit Chrome ohnehin schon viel, aber der Unterschied zwischen Werbung-Optimierung und der Nutzung menschlicher Kognitionsprozesse als allgemeines KI-Trainingsdatenset ist fundamental.