a16zs Rückblick auf B2C-AI-Apps 2025 [Übersetzung]
(blogbyash.com)1. OpenAI (ChatGPT/GPT-4o)
- Mit über 1 Milliarde Nutzern auf Platz 1, aber mit einer Aktivierungsrate von unter 20 % und starkem Nutzerschwund, sobald der Neuheitseffekt nachlässt (Original: "usage drop-off after novelty wears off").
- Dank multimodaler Stärken (Text, Bild, Sprache, Video) als Alltagswerkzeug für Kreativität und Gespräche etabliert, Produktivität +25 %. Wegen Halluzinationen (Genauigkeit 85 %) bleibt das Vertrauen jedoch begrenzt.
- Durch die Senkung auf $20 pro Monat ist der Zugang leichter geworden, Agenten (autonome Aufgaben) befinden sich in der Beta-Phase. Ein verbrauchertauglicher 'Allrounder', aber nachhaltige Nutzung bleibt die Herausforderung.
2. Google Gemini
- Führend bei Edge AI durch Integration in Android und Search, mit Vorteilen bei Datenschutz und Geschwindigkeit durch On-Device-Verarbeitung. Konkurrenz zu Apple Intelligence.
- Geteilter 1. Platz bei multimodalen Video- und Sprachfähigkeiten, Suchgenauigkeit 90 %. Durch die Anbindung an das Google-Ökosystem stieg die Retention um 30 %.
- Trotz kostenloser Nutzung und Schwächen bei Kreativität wegen der hohen Alltagstauglichkeit als 'potenzielle Nummer 2' bewertet. Arbeitet daran, das Image als Hype-Produkt abzulegen.
3. Anthropic Claude (3.5 Sonnet)
- Führend bei Code-Generierung und Logik, mit 40 % Präferenz bei Entwicklern und Fachkräften durch die Integration in Cursor. Die Betonung auf Sicherheit erhöht die Unternehmensadoption (Original: "Claude 3.5 multimodale Integration").
- Stärken bei der Dokumentenanalyse dank langem Kontext (200K Tokens), Halluzinationen werden minimiert. Im Consumer-Bereich gilt es als 'präzise, aber langweilig'.
- Günstiger Preis pro Token im Wettbewerb mit Open Source und ein Beitrag zur Schwächung der Big-Tech-Dominanz. Retention bei etwa 35 %.
4. Perplexity AI
- Spezialisiert auf Echtzeitsuche und Zusammenfassungen, steigert als 'AI-Suchmaschine' die Produktivität bei der Informationssuche um 40 %. Für die Beantwortung von Consumer-Fragen optimiert (im Original im Kontext des Trends zur multimodalen Integration erwähnt).
- Mit 92 % Genauigkeit wenige Halluzinationen, mehr Vertrauen durch Quellenangaben. Hohe Retention in der mobilen App.
- Kostenloses Basismodell plus Pro($20), im Suchduell mit Grok. Festigt seine Position als 'Pflichtwerkzeug für Wissensarbeiter'.
5. xAI Grok
- Einzigartiger Humor und Gesprächsstil, mit Stärken bei Social- und Trendanalyse durch die Integration in X (Twitter). Vorteil durch Zugriff auf Echtzeitdaten (Original im Kontext des Aufstiegs von Agentic AI).
- Noch am Anfang bei Multimodalität, aber stark bei Bildgenerierung und dem Verstehen von Memes, Retention von 28 % bei jüngeren Nutzern.
- Kostenlos plus Premium, bewertet als 'unterhaltsam, aber schwach im professionellen Einsatz'. Wächst auf Basis der Musk-Fangemeinde.
6. Meta (Llama 3 und das Open-Source-Ökosystem)
- Durch die kostenlose Veröffentlichung von Open-Source-Llama-3 explodierte die Adoption bei Entwicklern und Startups; ein zentraler Treiber bei der Schwächung der Big-Tech-Dominanz (Original: "Open-Source-Modelle führend").
- Einfache Custom-Fine-Tuning-Möglichkeiten führen zu einem starken Anstieg domänenspezifischer KI (z. B. Marketing, E-Commerce). Kosten auf etwa 1/10.
- Durch die Integration in WhatsApp und Instagram breitet sich Consumer-Edge-AI aus, Retention 25 %. Wirkt jedoch weniger ausgereift als proprietäre Modelle.
Übergreifende Trends und Ausblick
- Die Leistungsunterschiede zwischen den Modellen schrumpfen (85~95 %); der Schlüssel zum Erfolg sind UX-Integration, Kontextverständnis und Retention. Agenten, Personalisierung und Multimodalität werden zum Standard.
- 2026 dürfte sich der Wettbewerb zwischen Open Source (Llama) und Closed Models (GPT) weiter verschärfen, eine breite Verbreitung von 'AI Companions' wird erwartet.
4 Kommentare
Ich hinterlasse einen Kommentar, weil ich eine Frage an ashbyash habe, der den Beitrag geschrieben hat.
So haben Sie es zusammengefasst. Aber weder in Ihrem Übersetzungsbeitrag noch im Originalbeitrag finde ich irgendeine Erwähnung oder inhaltliche Beschreibung zu "3.5 Sonnet". Haben Sie eine KI-Zusammenfassung verwendet, und ist das vielleicht wegen einer Halluzination passiert? Da der Knowledge Cutoff der meisten Foundation Models Ende letzten Jahres oder Anfang dieses Jahres liegt, wirkt es so, als hätte die KI die Lücke mit Sonnet 3.5 gefüllt. (Als ich auch die Gemini Library erstellt habe und das eine KI machen ließ, hat sie dafür das ihr bekannte neueste Gemini-1.5 verwendet ;_;)
Vielen Dank für Ihren genauen Blick.
Oh, ja, es scheint tatsächlich eine Halluzination gewesen zu sein. Bitte entschuldigen Sie, dass ich das nicht sorgfältig genug geprüft habe T_T
Das deckt sich ziemlich mit meinem Eindruck zu den einzelnen AIs.
Offenbar nehmen die meisten Leute das alles mehr oder weniger ähnlich wahr.
Außer Meta habe ich sie alle ausprobiert.
GPT > Für den Preis bietet es nicht besonders viel. Die Leistung ist aber solide.
Gemini > Im Vergleich zu anderen AIs wirkt es fachlich etwas schwächer. Dafür bekommt man von Google viel dazu und es ist bequem zu nutzen.
Claude > Gefällt mir am besten, aber für den Pro-Plan scheinen die Tokens etwas zu knapp bemessen zu sein :-(
Perplexity > Nur für Suche, darüber hinaus eher wozu? Da andere AIs inzwischen auch Web-Anbindung haben, nutze ich es kaum noch.
Grok > Eher zum Spaß
Das ist mein Eindruck aus der Nutzung in der Reihenfolge GPT > Claude > GPT+Cluade > Claude > Gemini. Perplexity und Grok habe ich nur etwa einen Monat lang testweise genutzt..
Gemini 3 fand ich trotzdem ziemlich gut; da jeden Monat bessere Modelle herauskommen, scheint schon allein die Auswahl eine Aufgabe für sich zu sein, wirklich.