2 Punkte von GN⁺ 2024-12-07 | 1 Kommentare | Auf WhatsApp teilen
  • Llama 3.3-Kollektion
    • Diese Kollektion enthält den Konverter und das ursprüngliche Repository von Llama 3.3
    • Zuletzt vor 8 Stunden aktualisiert
    • Insgesamt 1 Eintrag enthalten

1 Kommentare

 
GN⁺ 2024-12-07
Hacker-News-Kommentare
  • Im Vergleich zu Llama 3.2 405B scheint die Leistung ähnlich oder leicht besser zu sein

    • Laut Zuck ist dies die letzte Veröffentlichung der Llama-3-Serie, und Llama 4 soll 2025 erscheinen
    • Erinnert an Steve Jobs’ berühmte Aussage über Dropbox: „eine Funktion, kein Produkt“
    • Meta stellt leistungsstarke Modelle als Open Source bereit, macht damit KI zur Commodity und kann so die Dienste von Facebook und Instagram stärken
    • Es geht nicht darum, KI zu verkaufen, sondern das Kerngeschäft mithilfe von KI zu stärken
    • Durch die Bereitstellung als Open Source ergeben sich Vorteile durch breite Akzeptanz und Weiterentwicklung
  • In unseren Benchmarks schneidet es besser ab als erwartet

    • Wir werden es uns noch genauer ansehen, aber es ist beeindruckend
  • Derzeit läuft weiterhin die Diskussion über einen guten „allgemeinen“ Mac-Desktop-Client

    • Man möchte Ollama, ChatGPT, Claude, Perplexity usw. nutzen
    • Man möchte KI-Chat in verschiedenen Apps verwenden, und es muss nicht unbedingt eine Desktop-App sein
    • MacMind ist cool, aber als Frontend für andere APIs kostet es viel
    • Auch die Antwort „Sei nicht knauserig“ ist nachvollziehbar
  • In mehreren Benchmarks zeigt es eine ähnliche Leistung wie GPT-4o

  • Auf Hugging Face wurden 4bit bitsandbytes, GGUFs und die ursprünglichen 16bit-Gewichte hochgeladen

    • Llama 3.3 70B kann mit weniger als 48 GB VRAM doppelt so schnell feinabgestimmt werden, bei 70 % geringerem Speicherverbrauch
  • Auf OpenRouter werden die Preise für 1M Token verfolgt, und bei jedem Aktualisieren sinkt der Preis weiter

  • Das Open-Sourcing von Llama ist ein hervorragendes Beispiel für die Strategie „Commoditize Your Complement“

    • Für alle, die diese Strategie nicht kennen, wurde ein Link zu Gwerns „Laws of Tech: Commoditize Your Complement“ geteilt
  • Frage zum Hugging-Face-Modell

    • Ob es sich auf einem Notebook über JupyterLab ausführen lässt
    • Welche Vorteile es hat
    • Ob es regelmäßig aktualisiert werden kann
    • Ob es für bestimmte Anwendungsfälle feinabgestimmt werden kann
    • Wie viel Zeit und Aufwand das Fine-Tuning eines Modells erfordert
    • Bitte um eine URL, ob Hugging Face Antworten auf diese Fragen bereitstellt
  • Meta übertrifft weiterhin die Erwartungen, indem es leistungsstarke offene Modelle veröffentlicht, die auf OpenAI/Anthropic zielen

    • Die größten Profiteure sind die Entwickler