Vorstellung des ChatGPT-Atlas-Browsers In den frühen Morgenstunden des 22. Oktober stellte OpenAI den neuen Webbrowser ChatGPT „Atlas“ vor.
Atlas ist ein KI-basierter Webbrowser auf Basis von ChatGPT, und OpenAI hat erklärt, dass dieses Projekt über einen langen Zeitraum intensiv vorbereitet wurde. OpenAI betrachtet KI als eine Chance, die etwa alle zehn Jahre kommt, und sieht darin einen Moment, um neu zu überlegen, was Browser leisten können, wie man sie nutzt und wie man das Web am produktivsten und angenehmsten nutzen kann. Obwohl das Tab-Modell hervorragend war, hat es seitdem kaum größere Browser-Innovationen gegeben – daher wird das Potenzial von Browsern neu gedacht.
Während URL-Leiste und Suchfeld früher die zentralen Bestandteile der Internetnutzung waren, sagte OpenAI, dass künftig eine auf Chat-Erfahrung basierende Webbrowser-Nutzung eine zentrale Rolle spielen würde. Deshalb begann man, den Browser rund um diese Nutzererfahrung zu gestalten. Bereits viele Aufgaben und ein Großteil des Alltags laufen im Browser. Wenn ChatGPT zu einer zentralen Hilfestellung wird, kann man mehr als bisher damit tun: auf Seiten chatten, mit ChatGPT Informationen finden oder den ChatGPT-Agenten innerhalb des Browsers nutzen. Weitere Funktionen sollen in Zukunft vorgestellt werden, sodass Nutzer sie direkt testen können.
Kernfunktionen von Atlas Atlas wurde aus der Frage entwickelt: „Was wäre, wenn man in einem Browser chatten könnte?“
Ausgehend von dieser Idee hat OpenAI jahrelang gewachsene, komplexe Funktionen in ein vereinfachtes Chaterlebnis überführt. Atlas ist kein herkömmlicher Browser mit zusätzlicher Chat-Schaltfläche; er ist darauf ausgelegt, ChatGPT ins Zentrum zu stellen. ChatGPT begleitet dabei bei der Websuche ständig und kann jederzeit helfen. OpenAI geht davon aus, dass Nutzer im Umgang mit Atlas mehr Fragen stellen und dadurch mehr lernen werden.
Atlas ist für neue und überraschende Erlebnisse konzipiert – schnell und flexibel.
Zu den Hauptfunktionen von Atlas gehören:
- Chat-Funktion
- Browser-Speicher-Funktion
- Agent-Funktion
Kernfunktionen von Atlas Beim ersten Öffnen von Atlas oder beim Erstellen eines neuen Tabs wird die Startseite angezeigt.
Die Oberfläche ist so gestaltet, dass sie wie ein klassischer Browser wirkt, enthält aber alle Funktionen von ChatGPT. In der Mitte befindet sich ein Composer für Chat-Fragen, und es gibt eine Seitenleiste mit Tools, Modellen und Chatverlauf. Als Browser lassen sich darüber hinaus weitere Aufgaben erledigen, etwa der Aufruf einer Website über eine URL oder das Öffnen von Seiten über ein Bookmark. Mit dem Browser-Speicher können außerdem vorher gesehene Webseiten gefunden werden, deren genaue Position man nicht mehr kennt.
Die Startseite von Atlas enthält außerdem eine Empfehlungsfunktion. Diese Empfehlungen werden anhand der Nutzeraktivität erstellt und können etwa passende Nachrichtenartikel oder Agent-Aufgaben vorschlagen. Je mehr Atlas genutzt wird, desto präziser werden die Vorschläge. In einem GitHub-Beispiel lässt sich beim Arbeiten mit Code ChatGPT in die Seitenleiste einladen, damit es den Inhalt einer Webseite versteht und ihn bearbeiten kann; damit wandelt sich das Tool von einer reinen Anzeigequelle zu einem Werkzeug, das Inhalte versteht und bearbeitet.
Tab öffnen Die Seite für einen neuen Tab ist der Startpunkt von Atlas. Stellt man eine Frage oder gibt eine URL ein, lassen sich schneller und nützlicher Ergebnisse an einem Ort abrufen. Für präzisere Ergebnisse außerhalb des Chat-Kontexts können im Tab Suchlinks, Bilder, Videos und (falls verfügbar) Nachrichten ausgewählt werden.
ChatGPT fragen Durch Klicken auf „ChatGPT anfordern“ öffnet sich die ChatGPT-Seitenleiste in der Seite, um Zusammenfassungen, Erklärungen oder Aufgaben direkt im Fenster zu bearbeiten. ChatGPT hat Zugriff auf die Details der aktuellen Seite, wodurch die Antworten hilfreicher sind und immer den richtigen Kontext liefern.
Cursor verwenden ChatGPT hilft bei der Texteingabe in offenen Textfeldern mit Inline-Editing und Vorschlägen.
Personalisierte Vorschläge ChatGPT merkt sich, was Nutzer erforschen, kann zu früher aufgerufenen Seiten zurückführen, in Themen tiefer einsteigen, passende Ideen vorschlagen oder Routineaufgaben automatisieren und dabei konkrete nächste Schritte empfehlen.
Fragen stellen Wenn etwas benötigt wird, kann jederzeit gefragt werden. Gibt man etwa „Öffne die Schuhe von gestern noch einmal“ oder „Tabs aufräumen“ ein, übernimmt der Rest ChatGPT.
Weitere Hinweise Mit aktiviertem Browser-Speicher merkt sich ChatGPT wichtige Details der Inhalte, nach denen gesucht wurde, um Chat-Antworten zu verbessern; daraus lassen sich beispielsweise To-Do-Listen aus der letzten Aktivität generieren oder auf Basis bestätigter Produkte Weihnachtsgeschenke weiter recherchieren. Der Browser-Speicher wird privat unter Kontrolle des ChatGPT-Kontos und der Nutzer gespeichert.
In den Einstellungen können alle Erinnerungen eingesehen und nicht mehr relevante Erinnerungen entfernt werden; außerdem können Verlaufseinträge gelöscht werden. Auch wenn der Browser-Speicher eingeschaltet ist, lässt sich über eine Umschaltung in der Adressleiste festlegen, welche Seiten ChatGPT sehen darf und welche nicht. Ist die Sichtbarkeit ausgeschaltet, kann ChatGPT keine Seiteninhalte sehen und es werden auf dieser Website keine Speicher-Einträge angelegt.
Standardmäßig werden die beim Navigieren gefundenen Inhalte nicht zum Training des Modells genutzt. Wenn diese Option gewählt wird, kann in den Data-Control-Einstellungen „include web browsing“ aktiviert werden; ist im ChatGPT-Konto das Chat-Training aktiviert, kann es für Atlas ebenfalls aktiviert werden. Dazu zählen die in der ChatGPT-Fragen-Seitenleiste angehängten Website-Inhalte und der Browser-Speicher, der dem Chat Informationen bereitstellt.
Die Kindersicherung gilt auch in Atlas. Wenn Eltern für ChatGPT bereits Kindersicherung konfiguriert haben, werden diese Einstellungen auf die Atlas-ChatGPT-Unterhaltungen übertragen. OpenAI führt außerdem neue Kindersicherungsoptionen in Atlas ein, etwa die Möglichkeit für Eltern, den Browser-Speicher und den Agent-Modus zu deaktivieren.
Beim Aufbau der ChatGPT-Agentfunktion in Atlas stand Sicherheit im Vordergrund; neue Schutzmaßnahmen wurden hinzugefügt, um Risiken aus dem Zugriff auf eingeloggte Sites und dem Durchsuchen des Verlaufs zu adressieren.
- In einem Browser können keine Codes ausgeführt, Dateien heruntergeladen oder Erweiterungen installiert werden.
- Auf andere Apps des Computers oder Dateisysteme kann nicht zugegriffen werden.
- Bei bestimmten sensiblen Seiten, etwa Bankseiten, kann der Zugriff vorübergehend pausiert werden, um eventuelle Aktionen zu prüfen.
- Im Abmeldemodus kann der Agent eingesetzt werden, um den Zugriff auf sensible Daten zu begrenzen und das Risiko zu reduzieren, dass er sich wie auf der Website selbst verhält.
Es bestehen weiterhin Risiken bei der ChatGPT-Agentfunktion. Der Agent kann nicht nur Fehler machen, wenn er für Nutzer handelt, sondern ist auch anfällig für versteckte bösartige Anweisungen, die beispielsweise in Webseiten oder E-Mails verborgen sein können und darauf abzielen, die vorgesehenen Verhaltensregeln des ChatGPT-Agenten zu umgehen. Dadurch könnten Daten auf eingeloggten Sites gestohlen oder unbeabsichtigte Aktionen durchgeführt werden.
Wie in der ChatGPT-Agent System Card beschrieben, hat OpenAI über tausende Stunden intensives Red Teaming durchgeführt und den Fokus darauf gelegt, vor allem solche Angriffe abzuwehren und Sicherheitsmechanismen zu entwerfen, die ChatGPT bei neuen Angriffen schnell anpassen. Dennoch lassen sich nicht alle Angriffe verhindern, die mit der steigenden Verbreitung von KI-Agenten einhergehen. Nutzer sollten sorgfältig abwägen, welche Informationen sie dem Agenten geben, im Abmeldemodus arbeiten oder die Aktivitäten des Agenten überwachen, um die Exposition zu minimieren. Entdeckte Schwachstellen werden kontinuierlich überwacht und gepatcht.
Dieser Launch ist ein Schritt in Richtung einer Zukunft, in der die Mehrzahl der Web-Nutzung über ein Agentensystem läuft; so können Routinen delegiert und die wirklich wichtigen Aufgaben fokussiert werden.
Suchfunktion und Cursor-Chat Der Agent-Modus von Atlas ist eine fortgeschrittene Funktion, mit der Atlas das Web durchstöbern und Aufgaben für den Nutzer ausführen kann.
Diese Funktion kann unangenehme oder zeitraubende Aufgaben übernehmen oder helfen, den Umgang mit neuer Software zu lernen. OpenAI zeigt sich beeindruckt von der Potenz, die ein Agent erhält, wenn er vollen Zugriff auf den Browser und das private Internet eines Nutzers bekommt. Sicherheit ist dabei zentral: Vom Modell bis zur Produkterfahrung sind auf allen Ebenen Schutzmaßnahmen integriert.
Über den Agent-Modus kann ChatGPT den Browser des Nutzers steuern und Aufgaben ausführen.
So kann ChatGPT beispielsweise in Google Docs die To-do-Liste einsehen, Personen erinnern, die noch keine Aufgaben eingegeben haben, oder alle aktuell erledigten Aufgaben in die Task-Management-Software Linear übertragen. Nutzer können die Aktionen des Agenten in Echtzeit beobachten. Der Agent-Modus kann auf lokale Anmeldedaten und den Verlauf zugreifen und wurde so entwickelt, dass er sich wie eine natürliche Erweiterung der Nutzer anfühlt.
Nutzungsszenarien und Sicherheitsüberlegungen im Agent-Modus Der Agent-Modus kann auch für private Zwecke verwendet werden.
So kann zum Beispiel auf einer Rezeptseite die nötigen Zutaten ermittelt, die erforderlichen Mengen berechnet und der Agent beauftragt werden, eine Einkaufsliste für den Supermarkt zu erstellen. ChatGPT merkt sich den bevorzugten Einkaufsort, ruft die entsprechende Website auf und fügt die benötigten Artikel in den Warenkorb. Der Agent unterstützt außerdem dabei, die Liste zu prüfen und bei Bedarf Artikel hinzuzufügen oder zu entfernen.
Die Freigabe des Browsers für einen ChatGPT-Agenten kann neue Risiken mit sich bringen.
Daher hat OpenAI Sicherheitsvorkehrungen eingerichtet, damit der ChatGPT-Agent nur in den Tabs des Nutzers arbeitet und weder auf dem Computer Code ausführt noch auf andere Dateien zugreift. Zudem kann der Nutzer selbst entscheiden, ob der ChatGPT-Agent auf eingeloggte Sites und Daten zugreifen darf; bei Bedarf kann der Secret-Mode verwendet werden. Atlas stellt verschiedene Optionen bereit, damit der Agent-Modus sicher genutzt werden kann, ohne die Privatsphäre der Nutzer zu gefährden.
Zukünftige Pläne OpenAI erwartet, dass ChatGPT Atlas von Nutzerinnen und Nutzern gut angenommen wird.
Der weltweite Rollout beginnt derzeit mit der macOS-Version. Der Agent-Modus steht zunächst nur Plus- und Pro-Nutzern zur Verfügung. Eine Windows-Version sowie Versionen für iOS und Android werden in Kürze nacheinander veröffentlicht. OpenAI plant, die Idee weiterzuentwickeln, dass nutzerdefinierte Anweisungen den Nutzer im Web begleiten, der Agent ihn immer besser kennenlernt, Aufgaben für ihn erledigt und vorab das Bereitstellt, was er braucht. Künftig wird auf Basis von Nutzerfeedback ChatGPT Atlas weiter verbessert.
3 Kommentare
Ich habe es auch am Veröffentlichungstag heruntergeladen und ausprobiert, aber das gleiche Verhalten wie die oben genannten Personen bestätigt. Ich denke, da es sich offenbar um einen Fehler handelt, wird es dafür ein Patch geben.
Bei der koreanischen Eingabe kommt es bei vielen Leuten offenbar zu einer Trennung in einzelne Jamos.
Ich habe es gerade installiert und ausprobiert, aber bei mir hat die Jaso-Trennung nicht funktioniert. Ich nutze gerade die Version Tahoe (26.0.1).