Ollama 0.4 unterstützt Llama 3.2 Vision
(ollama.com)- Llama 3.2 Vision ist ein Modell zur Bildinferenz und -generierung in den Größen 11B/90B
- Optimiert für visuelle Erkennung, Bildinferenz, Caption-Generierung und die Beantwortung allgemeiner Fragen zu Bildern
- Kann mit
ollama run llama3.2-vision:90bausgeführt werden; danach lassen sich Bilder zum Prompt hinzufügen und Fragen dazu stellen - Anwendungsbeispiele: Handschrifterkennung, OCR, Interpretation von Diagrammen/Tabellen, Bild-Q&A
Noch keine Kommentare.