Comet – Perplexitys Web Agent und Browser

(perplexity.ai)

7 Punkte von sungmin330 2025-07-31 | 4 Kommentare | Auf WhatsApp teilen

Comet: Ein neuer Browser von Perplexity

Der Launch liegt zwar schon etwas zurück, aber nachdem ich durch die Warteliste gekommen bin, habe ich ihn ausprobiert und dazu etwas aufgeschrieben.

Zentrale Übersicht

Comet ist ein von Perplexity entwickelter AI-Browser, der die Konzentration und den Workflow der Nutzer maximieren und Neugier in Umsetzung verwandeln soll.

Wichtige Funktionen und Merkmale

AI-integrierte Suche, unmittelbarer Kontext, Website-Automatisierung
- Direkt im Browser sind Zusammenfassungen, Shopping, Terminplanung und Recherche möglich
Comet Assistant
- Automatisiert wiederkehrende Aufgaben wie Klicken, Eingaben, Absenden und Autovervollständigung
Automatisierung auch komplexer Aufgaben
- Unterstützt den gesamten Shopping-Prozess von Produktvergleichen bis zur Bezahlung
Integrierte Verwaltung
- Verknüpfung mit E-Mail und Kalender (Gmail, Google Calendar)
- Termin-Briefings sowie das Planen von E-Mails und Terminen direkt im Browser
Personalisierte Erfahrung
- Lernt Nutzungsmuster und organisiert Tabs sowie Insights automatisch
Antworten direkt aus den eigenen Aktivitäten finden
- Unterstützt die Suche in persönlichen Daten wie Verlauf, Videos und Dokumenten
Smarte Aktionen und Fokus-Funktion pro Tab
- Die @tab-Funktion liefert Echtzeit-Antworten passend zum geöffneten Tab

Anwendungsfälle

Perplexity hat auf LinkedIn zusätzlich Anwendungsfälle veröffentlicht.
https://www.linkedin.com/company/perplexity-ai/posts/?feedView=all

Persönliche Eindrücke nach der Nutzung des Dienstes

Technik

Chromium-Browser + Perplexity + Web-Agent-Struktur
Natürlichsprachliche Query -> Intent-/Slot-Extraktion -> Semantic-DOM-Mapping -> Umwandlung in Aktionen -> Event-Ausführung (Web Tool) -> Parsing und Vorverarbeitung der Ergebnisse -> vermutlich eine ReAct-artige Struktur
Comet erstellt Screenshots, sodass sich der aktuelle Arbeitsstand nachvollziehen lässt; ob dabei zusätzlich ein Vision-Modell zur Analyse eingesetzt wird, müsste noch geprüft werden

Testfälle

(1) E-Mail verfassen

Nutzt die Google-Mail-Website sinnvoll, um eine E-Mail zu schreiben
Der Agent sendet nicht tatsächlich, sondern wählt das Zwischenspeichern als Entwurf

(2) Routenplanung in Naver Maps + Restaurantempfehlungen in der Umgebung

Nach dem Besuch der Naver-Maps-Webseite wurde gefragt, eine Route von Seoul Station nach Jamsil zu finden, und der Dienst nutzte Naver Maps passend (wie ein Mensch), um die Route zu finden
Für die Suche nach Restaurants in der Umgebung wurde nicht Naver Maps, sondern das bisherige Search Tool von Perplexity verwendet

(3) Crawling von Open AI Platform Pricing

Soweit bekannt, nutzt Open AI Platform Remix, und einige API-Preise sind per Toggle ausgeblendet
Comet wurde explizit angewiesen, die Toggles zu öffnen, die Preise aller APIs zu prüfen und das Ergebnis als Markdown auszugeben, was passend geliefert wurde
Allerdings ist Prompt Engineering nötig, damit die Informationen exakt extrahiert werden
Auch die API-Seite von Anthropic wurde prüfen lassen, aber wegen des uneindeutigen Layouts der Webseite (Divider) konnte die komplexe API-Policy nicht exakt geparst werden. Grundlegende API-Preise wurden jedoch korrekt extrahiert.

Persönliche Meinung

Beim Entwickeln eines Browsing-Agenten dürfte es viele Punkte wie Kontext, Rendering usw. gegeben haben, die berücksichtigt werden mussten; ich bin neugierig, wie das gelöst wurde.
Technisch ist ein Wow-Effekt da, aber aus Produktsicht wirkt es für mich noch etwas unklar.
Das mag je nach Person unterschiedlich sein, aber für mich ist noch nicht klar, warum ich dieses Produkt nutzen sollte, warum ich Geld ausgeben sollte, um Comet zu verwenden, und welches Problem von mir als Kunde es eigentlich löst. Anders gesagt: Das Value Proposition ist für mich noch nicht eindeutig. Aktuell ist mein Eindruck eher: „Oh, interessant, das funktioniert ja. Ich sollte es bei Gelegenheit noch ein paar Mal ausprobieren.“
Natürlich zeigt Perplexity Anwendungsfälle, aber ich frage mich trotzdem: „Ist das wirklich ein Problem, das unbedingt ein Agent lösen muss? (Wenn ich es selbst mache, geht es oft schneller.)“ und „Ist das Problem damit wirklich vollständig gelöst?“
Vielleicht fühlt es sich auch deshalb so an, weil ein Browser eher nah an Infrastruktur ist — das ist zumindest meine vorsichtige Vermutung.
Ein AI-Agent-basierter Browser ist gewissermaßen ein neues Format. Wenn man Kunden gut zeigen kann: „Welches Problem hast du, und wie kann Comet dieses Problem wirklich vollständig lösen?“, dann könnte das funktionieren.
Ich werde es weiter beobachten und noch etwas mehr nutzen. Ich frage mich, wie sich diese produktbezogenen Probleme lösen lassen.

UI

Das ist eine Analyse, die ich persönlich gemacht habe. (Ich arbeite gerade daran, sie als Reverse-Planning nachzubauen...,)
https://www.figma.com/deck/Gky9ZDEqZKdJfG4RWoNYdf

4 Kommentare

cshj55 2025-08-01

Gab es bei euren Erfahrungen eine Nutzungsbeschränkung für Anfragen an den Comet-Agenten? Oder ist es wie bei anderen Tools so, dass während der Testphase die Anzahl der Anfragen keine Rolle spielt? Ich meine mich zu erinnern, dass es so etwas wie pro-max gab, deshalb frage ich aus Interesse nach.

sungmin330 2025-08-02

Ich habe derzeit ein Pro-Abo. Vielleicht liegt es daran, dass ich es eher wenig genutzt habe, aber ich bin bei Perplexity, einschließlich Comet, bisher noch nie an ein Limit gestoßen. Es wirkt sogar lockerer als gedacht.
Da im Abo-Plan kein Ratelimit angegeben ist, weiß ich es nicht mit Sicherheit.
Zunächst einmal scheint die Beta-Release anders als bei Pro Max vergeben worden zu sein.

https://perplexity.ai/help-center/en/…

Das ist nur mein persönlicher Eindruck, aber wie Sie gesagt haben, scheinen die Abfragen in der Testphase keine Rolle zu spielen. Ich habe sogar bestätigt, dass die Arbeit funktioniert, wenn man 12 virtuelle Browser parallel auf einmal startet. Das ist schon erstaunlich.

nottiger 2025-08-01

Danke, ich habe es gerne gelesen.
Wie erwartet, daher ist es ein wenig schade..

cenoch 2025-08-01

Ich stimme zu, dass man technisch zwar ein Wow sieht, es aus Produktsicht aber noch unklar wirkt.

Dem stimme ich zu.

Die Arbeitsgeschwindigkeit des Agenten ist viel zu langsam, und zugleich ist die Leistung nicht so gut, dass man ihm einfach vertrauen, es delegieren und dann vergessen könnte.
Es scheint keine Möglichkeit zur Modellauswahl zu geben, daher werden die meisten Aufgaben vermutlich mit dem hauseigenen Modell von Perplexity erledigt, aber die Halluzinationen sind viel zu stark.
Beispiel: Wenn man die Naver-Nachrichtenseite lesen lässt und darum bittet, den Tonfall der einzelnen Zeitungen zu den Zollverhandlungen zusammenzufassen, antwortet es mit erfundenen Positionen von Zeitungen, die es gar nicht gelesen hat, und zwar auf Grundlage von „vorab antrainierten Vorurteilen über die Ausrichtung der jeweiligen Verlagshäuser“.
Damit solche Aufgaben wirklich sauber ausgeführt werden, braucht es Prompt Engineering sowie wiederholte Überprüfung/Korrektur; der Aufwand dafür wirkt größer als der Nutzen, den man durch die Automatisierung mit Comet gewinnen könnte.
Man sieht die technischen Herausforderungen, auf die sie im Entwicklungsprozess gestoßen sein müssen, daher gibt es aus Sicht eines „Entwicklers“ durchaus interessante Aspekte daran, aber als Produkt ...