Ollama 0.4 unterstützt Llama 3.2 Vision

xguru · 2024-11-08T10:17:01+09:00

Llama 3.2 Vision ist ein Modell zur Bildinferenz und -generierung in den Größen 11B/90B Optimiert für visuelle Erkennung, Bildinferenz, Caption-Generierung und die Beantwortung allgemeiner Fragen zu Bildern Kann mit ollama run llama3.2-vision:90b ausgeführt werden; danach lassen sich Bilder zum Prompt hinzufügen und Fragen dazu stellen Anwendungsbeispiele: Handschrifterkennung, OCR, Interpretation von Diagrammen/Tabellen, Bild-Q&A

(ollama.com)

8 Punkte von xguru 2024-11-08 | Noch keine Kommentare. | Auf WhatsApp teilen

Llama 3.2 Vision ist ein Modell zur Bildinferenz und -generierung in den Größen 11B/90B
- Optimiert für visuelle Erkennung, Bildinferenz, Caption-Generierung und die Beantwortung allgemeiner Fragen zu Bildern
Kann mit ollama run llama3.2-vision:90b ausgeführt werden; danach lassen sich Bilder zum Prompt hinzufügen und Fragen dazu stellen
Anwendungsbeispiele: Handschrifterkennung, OCR, Interpretation von Diagrammen/Tabellen, Bild-Q&A

Ollama 0.4 unterstützt Llama 3.2 Vision

Verwandte Beiträge

Noch keine Kommentare.