Microsoft führt den Copilot-Modus in Edge ein
(blogs.windows.com)- In den Edge-Browser wurde die experimentelle KI-Funktion „Copilot-Modus“ eingeführt, die über einfaches tabbasiertes Web-Browsing hinausgeht und die Web-Erfahrung der Nutzer aktiv unterstützt sowie Arbeitsabläufe im Web neu gestaltet.
- Im Copilot-Modus werden Chat, Suche und Navigation in einem einzigen Eingabefeld zusammengeführt, wobei der Kontext mehrerer Tabs erkannt wird, um den Vergleich, die Entscheidungsfindung und die Aufbereitung von Informationen zu unterstützen.
- Mit natürlicher Sprachnavigation über Sprachbefehle, Aktionen in Echtzeit (Action), einem dynamischen Hilfepanel usw. ist eine effiziente Navigation ohne Klicken oder Tippen möglich.
- Mit verstärktem Datenschutz/Sicherheit als Grundlage und der Möglichkeit, die Funktion jederzeit ein- oder auszuschalten, wird die Browserdatenverarbeitung und der Zugriff klar verwaltet.
- Der Modus ist kostenlos und vollständig optional (Opt-in), in Edge für Windows/Mac zeitlich befristet verfügbar und soll auf Basis von Feedback fortlaufend weiterentwickelt werden.
Was ist der Copilot-Modus?
- Ein neuer Browsermodus, der von der bisherigen linearen Tab-Navigation abweicht, indem die KI aktiv Nutzerabsicht und Kontext erkennt und Vorschläge macht sowie unterstützt.
- Beim Öffnen eines neuen Tabs wird eine schlanke UI mit einem Eingabefeld bereitgestellt, das Chat, Suche und Navigation integriert.
- Copilot versteht die Gesamtsituation aller vom Nutzer geöffneten Tabs und unterstützt aktiv komplexe Suchprozesse wie den Vergleich, die Entscheidung und die Zusammenfassung von Informationen.
Hauptfunktionen
-
Multi-Tab-Kontext-Browsing
- Copilot erkennt den Kontext aller geöffneten Tabs und minimiert z. B. beim Urlaubsvergleich den manuellen Aufwand, indem es schnell die Unterkunft mit dem geringsten Abstand zum Strand findet
-
Sprachbefehle und Action
- Sprachbefehlsunterstützung: „Finde mir diese Informationen auf der Seite“, „Öffne einen Tab zum Vergleichen der Produktoptionen“ – solche Anfragen sind in natürlicher Sprache möglich.
- In Zukunft soll Copilot durch optionale Verknüpfung von Verlauf und Anmeldedaten Buchungen, Käufe und Datensammlung als zusammengesetzte Aufgaben automatisieren können.
-
Dynamisches Hilfepanel & Informationszusammenfassung
- Rufen Sie Copilot bei Bedarf als Panel auf und lassen Sie sich ohne Seitenwechsel z. B. Rezeptkonvertierung, Übersetzung, Entfernung von Pop-ups oder die Zusammenfassung langer Texte bereitstellen, um ablenkende Faktoren zu reduzieren und sofort Kerninformationen zu erhalten
-
Anschluss von Arbeits- und Suchreisen
- Künftig werden Browserverläufe von Vergangenheit bis Gegenwart zu themen- und projektbezogenen „Journeys“ aufbereitet, um Folgeaktionen, Lernen und personalisierte Vorschläge zu unterstützen
- Nutzer können jederzeit klar erkennen und steuern, wann und in welchem Umfang Copilot auf Daten zugreift
Datenschutz und Benutzerkontrolle
- Basierend auf Microsofts belastbaren Datenschutz- und Sicherheitsstandards können Nutzer die Datenerfassung und -nutzung selbst einstellen und steuern.
- Der Copilot-Modus kann in den Edge-Einstellungen jederzeit ein- und ausgeschaltet werden; wird er nicht genutzt, bleibt die bisherige Edge-Umgebung unverändert.
- Beim Zugriff auf oder bei der Analyse von Browserdaten durch Copilot wird stets eine klare visuelle Benachrichtigung angezeigt.
Experimentelle Einführung und Feedback
- Der Copilot-Modus wird als kostenlose, befristete Opt-in-Option zuerst bereitgestellt und auf Basis von Nutzerfeedback kontinuierlich weiterentwickelt.
- Sie können über die Discord-Community und weitere Kanäle an der Ideeneinreichung und Diskussion teilnehmen.
So starten
- Probieren Sie Copilot direkt auf aka.ms/copilot-mode aus, testen Sie die neue KI-Browsing-Erfahrung und geben Sie Feedback.
1 Kommentare
Hacker-News-Kommentare
Es ist in letzter Zeit schwer nachzuvollziehen, was Microsofts Copilot-Strategie eigentlich sein soll. Es gibt bereits Dutzende ähnlicher Funktionen, alle mit unterschiedlichen Preisen, aber nichts davon funktioniert wirklich richtig. Geld verdienen ließe sich eher mit etwas Alltäglichem wie „in Excel per natürlicher Sprache komplexe Zusammenfassungen und Analysen anfordern und dabei automatisch neue Tabellenblätter und Diagramme erzeugen“. Der aktuelle Copilot erklärt aber nur die einzelnen Schritte. Excel und Office haben bereits APIs, also würde schon eine KI, die natürliche Sprachbefehle mit praktischer Excel-Arbeit verbindet, in praktisch jedem Unternehmen genutzt werden. Ich brauche so ein Tool selbst dringend und habe deshalb mehrere KIs ausprobiert, aber keine liefert bisher wirklich das, was ich will. Offenbar ist das Problem schwieriger als gedacht, aber selbst Microsoft hat es trotz Investitionen in Milliardenhöhe bislang kaum gelöst. Geschäftslogik in Unternehmen ist hier der Kern, und es ist enttäuschend zu sehen, dass sie das nicht wirklich mit neuen Ideen weiterentwickeln
Angesichts der gewaltigen Summen, die in KI fließen, drücken Microsoft und andere noch unfertige KI-Produkte mit Gewalt in den Markt. Es muss erst einmal irgendetwas veröffentlicht werden, also sammelt man mit unausgereiften Diensten Nutzerdaten und hofft, mit diesen Daten irgendwann bessere KI zu bauen. Gleichzeitig versucht man, den Nutzern unbewusst anzugewöhnen, zuerst nach KI zu greifen
Ich habe ChatGPT Pro abonniert und tatsächlich versucht, mir Excel-Zusammenfassungen erstellen zu lassen. Es legte mit großem Eifer los, aber am Ende kam eine enttäuschende Datei heraus, mit chaotischem Format und teilweise abgeschnittenen Daten
Vor Kurzem sah ich in einer Firmenschulung zu Copilot, wie das Laden einer CSV-Header-Datei fehlschlug und man 15 Minuten lang daran herumdokterte. Das vermittelte den Eindruck, dass eine technisch verlässliche KI-Excel-Integration noch weit davon entfernt ist, wirklich verkaufsreif zu sein
Ich hatte einen ähnlichen Gedanken: Was Microsoft wirklich bauen sollte, wäre eine ganz einfache „KI-Skriptaufzeichnungsfunktion“. Wenn man etwa einen wiederkehrenden Ablauf wie CSV herunterladen → Daten aufbereiten → neues Tabellenblatt hinzufügen → validieren → ins System hochladen einmal per KI aufzeichnen und später automatisieren könnte, dann würde das die Effizienz von Menschen enorm steigern, auch wenn sie sich weder mit Programmierung noch mit Excel oder VBA gut auskennen. In den meisten Unternehmensabteilungen gibt es enorme Mengen an repetitiver Datenarbeit
„KI sollte sich natürlich in den OS-Workflow einfügen und durch bessere Suche, OCR, Handschrifterkennung und Ähnliches die echte Nutzererfahrung verbessern. Nicht einfach krampfhaft irgendwo ein Chatfenster dranhängen — entscheidend ist Natürlichkeit. Es gibt immer weniger Gründe, Edge zu benutzen. Das Problem ist, dass man offenbar auch in alle Entwicklerwerkzeuge wie VS, VSCode, PowerShell, Windows Terminal, Aspire und Azure KI hineindrücken will. Man sieht, wie jedes Team unter KI-Zielvorgaben ächzt“
Microsofts jüngste Schritte wirken auf mich eher benutzerfeindlich als nutzerorientiert. Edge-Zwang, Dark Patterns, zurückgesetzte Telemetrie-Einstellungen, die Recall-Kontroverse — es gibt viele Beispiele, die die Ermüdung der Nutzer verstärken. Meine Vermutung ist, dass Microsoft auf Googles Browserumsätze schielt und eine Haltung vorherrscht wie: „Weil wir das OS kontrollieren, sollten wir daraus mehr Gewinn herausholen.“ Diese Jagd nach kurzfristigem Profit verbraucht Vertrauen, das über Jahrzehnte aufgebaut wurde. Sinnvoller wäre es, Windows zu einem Vorbild für Datenschutz zu machen oder wie macOS ein echtes Ökosystem nativer Apps zu fördern, um langfristige Loyalität zu gewinnen
Microsoft scheint sich wenig Sorgen zu machen, weil man selbst auf Kosten der Nutzer sehr viel Geld verdienen kann und Windows-Anwender nur begrenzte Alternativen haben. Wer zu Apple wechseln wollte, ist ohnehin längst gewechselt, Linux wächst zwar langsam, aber selbst das scheint man nicht wirklich zu fürchten. Ein Monopolist muss sich irgendwann weder besonders um Loyalität noch um echte Wertschöpfung kümmern
Bei manchen Microsoft-Produkten sah ich enormes Potenzial, aber die Stimmung im Management, jeden möglichen Nutzerwert maximal auszupressen, ist immer stärker geworden. Es wäre besser gewesen, sich auf die Grundlagen zu konzentrieren: eine konsistente UI, keine aufgedrängte Werbung oder Suchergebnisse, also Produkte, die ihre Basics gut beherrschen. Früher war ich ein Edge-Fan, aber zusätzliche Spielereien wie Coupons haben mich enttäuscht. VS Code ist großartig, doch bei .Net-Support, ARM, RDP, Copilot und Ähnlichem bin ich zunehmend ernüchtert. Selbst im Vergleich zu Open Source und Alternativen fehlt oft genau die Funktion, die man am dringendsten braucht. Für neue Projekte würde ich inzwischen lieber PostgreSQL statt MS-SQL verwenden. Lösungen auf Basis von Windows Server meide ich ebenfalls, und selbst bei VS Code bin ich inzwischen am Überlegen
Googles Einnahmen stammen größtenteils aus Werbung, und Dienste wie Chrome und YouTube sind kostenlos — das ist der besondere Punkt. Microsoft war traditionell eher auf bezahlte Produkte wie Windows und Office ausgerichtet
Es gibt einen Bloomberg-Artikel zur Analyse von Microsoft Copilot sowie die dazugehörige HN-Diskussion. „Am Ende will schlicht niemand Copilot benutzen, weil die Qualität zu schlecht ist“
Als Edge neu war, mochte ich ihn genug, um ihn eine Zeit lang als Standardbrowser zu verwenden. Aber nach und nach kamen immer mehr unnötige Funktionen wie Coupon-Angebote hinzu, die ich alle manuell deaktivieren musste, und am Ende bin ich wieder zu Brave zurückgekehrt. Die Browser-Synchronisierung ist gut, aber Marketing-Anzeigen und kommerzielle Eigenwerbung kann ich überhaupt nicht ausstehen. Als in der Suche Werbung auftauchte, bin ich sofort zu Linux gewechselt. Laut US-Regierungsstatistiken ist der Anteil von Linux auf dem Desktop zuletzt auf 6 % gestiegen, und Valve/Steam hat die Spielekompatibilität real spürbar verbessert. Microsoft hatte viele gute Chancen bei Entwicklerwerkzeugen und Diensten wie .Net und VS Code, aber es ist enttäuschend, wie hartnäckig man beim normalen Nutzer nur auf Monetarisierung drängt. Heutzutage sollte kommerzielle Software die Paketierung für Linux — besonders AppImage und Flatpak — auf jeden Fall mitdenken, und auch beim Markt für Adobe-Alternativen gibt es viele Chancen
Es wird erwähnt, dass Copilot den Kontext aller offenen Tabs versteht. Die Sorge ist, dass dieser Kontext vergiftet wird, wenn unter den geöffneten Tabs viele minderwertige SEO-Spam-Blogs sind. Wenn Content-Produzenten künftig sogar raffinierte Falschinformationen massenhaft ins Web kippen, besteht das Risiko, dass eine KI sie unkritisch zitiert. Wenn ich Informationen selbst bewerte, achte ich stark auf die Vertrauenswürdigkeit der Quelle, und genau damit tun sich KIs schwer. Die Vermutung ist, dass eine saubere Quellenzuordnung strukturell schwierig ist, insbesondere bei KI-Systemen, bei denen der Verdacht massenhafter Datennutzung ohne Erlaubnis im Raum steht
Es wird ein Beispiel genannt, bei dem Copilot bei einem bestimmten Nutzer, etwa Dylan, aus dessen Vorlieben schließt, dass er Fußball mag, und beim Start des Browsers Tickets empfiehlt. Das wirkt weniger wie echte Unterstützung des Nutzerverhaltens als wie ein erzwungen hineingedrücktes KI-Feature. Kritisiert wird auch, dass es einfach ständig auftaucht, selbst ohne ausdrücklichen Prompt
Es fühlt sich an, als sei im KI-Zeitalter grundlegendes Product Management verschwunden. Wer hat sich so etwas wie diese Browser-Automatisierung tatsächlich gewünscht, und wo genau soll hier der Product-Market-Fit liegen?
Es gibt viel negative Bewertung, aber ich sehe das eher positiv. Für Safari und Firefox gibt es zwar einige Plugins, aber als Nutzer habe ich immer eine tiefe Integration vermisst, die den gemeinsamen Kontext über mehrere Tabs hinweg versteht. Wenn man bei Recherche 15 oder mehr Tabs offen hat, ist es attraktiv, einem LLM Fragen auf Basis des Gesamtkontexts zu stellen. Der einzige Grund, warum ich es noch nicht installiert habe, ist das Gerücht, dass OpenAI an einer ähnlichen Funktion arbeitet. Ich hoffe, dass bald etwas Vergleichbares erscheint
Daten aus Websites ohne API zu extrahieren, zu bearbeiten und zu automatisieren, ist eine sehr schwierige Aufgabe. Bei den meisten Datenanalyse-Arbeiten gehören solche internen Projekte unvermeidlich dazu. Wenn Websites ihren Dienst nicht offiziell anbieten oder technisch nicht in der Lage sind, APIs bereitzustellen, bleibt Menschen oft nur wiederholtes Klicken und Herunterladen. Bisher waren RPA-Lösungen (Robotic Process Automation) dafür noch die naheliegendste Alternative. Ohne böse Absicht überwiegt dabei oft der Effekt, Menschen von stumpfer Wiederholungsarbeit zu befreien
Ich glaube, dass die eigentliche Innovation darin liegen wird, das Betriebssystem durch eine KI-artige Schnittstelle zu ersetzen. Im Moment drehen sich alle nur im Kreis auf Browser-Ebene, aber das wahre Ziel ist, die Art, wie Menschen mit Technik interagieren, grundlegend zu verändern. Im Grunde ist der wichtige Versuch: „Wenn ohnehin alles, was man braucht, ChatGPT ist, warum dann nicht das gesamte OS als Chat-Interface umsetzen?“