AI-Agent mit 7B Parametern schlägt GPT-4o: Microsoft Fara-7B
(aisparkup.com)Fara-7B, entwickelt von Microsoft Research, ist ein kleiner AI-Agent mit 7 Milliarden Parametern, der Computeraufgaben wie Web-Navigation, Ausfüllen von Formularen und Reservierungen direkt ausführt. Im WebVoyager-Benchmark erreichte er eine Erfolgsquote von 73,5 % und lag damit vor GPT-4o (65,1 %) und UI-TARS (66,4 %). Das Modell läuft ohne Cloud direkt auf dem PC des Nutzers und schützt so die Datenprivatsphäre. Dabei nutzt es einen Ansatz der „Pixel-Souveränität“, bei dem allein auf Basis von Screenshots Mausklicks, Tastatureingaben und Scrollen verarbeitet werden, was effizient ist (im Schnitt Abschluss in 16 Schritten).
Das Funktionsprinzip beruht darauf, dass über das Magentic-One-System 145.000 synthetische Aufgabenpfade erzeugt und komprimiert wurden, mit deren Daten das Modell trainiert wurde. Auf der NPU von Copilot+ PCs läuft es schnell. Zu den Sicherheitsfunktionen gehört, dass an „Critical Points“ eine Bestätigung des Nutzers erforderlich ist und sich Aktionen über Magentic-UI verfolgen und beeinflussen lassen. Veröffentlicht wurde es unter der MIT-Lizenz auf Hugging Face und Microsoft Foundry.
Auch in anderen Benchmarks (Online-Mind2Web 34,1 %, DeepShop 26,2 % usw.) zeigte es starke Leistung, allerdings gelten sinkende Genauigkeit bei komplexen Aufgaben und Halluzinationsprobleme als Einschränkungen. Microsoft bewertet es als „Proof of Concept“ und erwartet, dass die Open-Source-Veröffentlichung das Entwickler-Ökosystem erweitert.
Fazit: Fara-7B zeigt das Potenzial kleiner Modelle und ist ein wichtiges Beispiel für den Beginn einer Ära persönlicher AI-Assistenten mit geringerer Cloud-Abhängigkeit. Künftig sind durch Reinforcement Learning sicherere und intelligentere Fortschritte zu erwarten.
1 Kommentare
Kleine Modelle reagieren zu stark auf Prompts und sind deshalb nicht leicht einzusetzen … Ist die einzige Lösung, immer wieder Tests zu wiederholen?