8 Punkte von xguru 2024-11-08 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Llama 3.2 Vision ist ein Modell zur Bildinferenz und -generierung in den Größen 11B/90B
    • Optimiert für visuelle Erkennung, Bildinferenz, Caption-Generierung und die Beantwortung allgemeiner Fragen zu Bildern
  • Kann mit ollama run llama3.2-vision:90b ausgeführt werden; danach lassen sich Bilder zum Prompt hinzufügen und Fragen dazu stellen
  • Anwendungsbeispiele: Handschrifterkennung, OCR, Interpretation von Diagrammen/Tabellen, Bild-Q&A

Noch keine Kommentare.

Noch keine Kommentare.