- Ermöglicht die einfache Entwicklung von KI-Agenten, die den Desktop-Kontext und die Aktivitäten von Nutzern verstehen und verbessern
- Zeichnet Bildschirm, Sprache, Tastatur, Maus und Kamera des Desktops vollständig auf
- Läuft zu 100 % lokal, plattformübergreifend und protokolliert rund um die Uhr alle Aktivitäten
- Extrahiert Text vom Bildschirm, transkribiert Audio und speichert sämtliche Nutzeraktionen in SQLite
- Bietet Embeddings, RAG-Pipelines, lokale LLMs mit Ollama sowie OpenAI-/Anthropic-Proxys
- Bietet ein sandboxed JS-Plugin-System
7 Kommentare
„Jede Sekunde, in der du nicht aufnimmst, ist ein fehlender Kontext für AGI“ wow
Etwas, das man irgendwann brauchen wird, aber es ist viel zu beängstigend ...
Seit Anthropic seine Computer-Use API vorgestellt hat, gibt es offenbar viele solche Versuche. Einerseits ist das beruhigend, andererseits macht es mir wie anderen auch etwas Sorgen, haha. (Insgesamt denke ich aber, dass das Teil eines Entwicklungsprozesses ist.)
Ich frage mich, wie man so etwas nutzen könnte..
Virus??
Oh, ein interessantes Projekt.
Es sieht so aus, als wäre Open Source besser als ein Großkonzern wie Microsoft.
Es scheint, als könnte das Sicherheitsprobleme verursachen.