Was in der ersten Woche nach der Ankündigung von Meta Llama 3 passiert ist

xguru · 2024-04-29T09:46:01+09:00

Seit der Veröffentlichung des Llama-3-Modells am 18.4. war die Reaktion der Entwickler-Community enorm Das Modell wurde mehr als 1,2 Millionen Mal heruntergeladen, und Entwickler haben auf Hugging Face mehr als 600 abgeleitete Modelle geteilt Das Llama-3-GitHub-Repository erhielt mehr als 17.000 Sterne Im LMSYS Chatbot Arena Leaderboard belegte das Modell Llama 3 70B Instruct in der nur auf Englisch basierenden Bewertung den 1. Platz und insgesamt den 6. Platz, womit es unter den offen verfügbaren Modellen den höchsten Rang erreichte (hinter geschlossenen proprietären Modellen) Frühe Anwendungsfälle von Llama 3 Partner aus den Bereichen Silizium, Hardware und Cloud-Bereitstellung haben begonnen, Llama 3 für Nutzer auszurollen An der Yale School of Medicine wurde gemeinsam mit der EPFL School of Computer and Communication Sciences innerhalb von 24 Stunden nach dem Release von Llama 3 ein auf Llama 3 feinabgestimmtes Modell vorgestellt: Llama-3[8B]-MeditronV1.0, das erste Llama-3-8B-Modell für den medizinischen Bereich Dieses neue Modell übertraf bei Standard-Benchmarks wie MedQA und MedMCQA alle aktuellen offenen Modelle derselben Parameterklasse Weitere Details dazu, wie Yale und die EPFL die erste Version von Meditron auf Basis von Llama 2 aufgebaut haben, finden sich unter dem entsprechenden Link Ausblick auf Llama 3 In den kommenden Monaten sollen Modelle mit neuen Funktionen veröffentlicht werden, darunter Multimodalität, mehrsprachige Gespräche, längere Kontextfenster und insgesamt verbesserte Fähigkeiten Weitere Informationen sollen bald folgen, und man freut sich darauf, die nächste Welle communitygetriebener Innovationen zu sehen

(ai.meta.com)

13 Punkte von xguru 2024-04-29 | 3 Kommentare | Auf WhatsApp teilen

Seit der Veröffentlichung des Llama-3-Modells am 18.4. war die Reaktion der Entwickler-Community enorm
- Das Modell wurde mehr als 1,2 Millionen Mal heruntergeladen, und Entwickler haben auf Hugging Face mehr als 600 abgeleitete Modelle geteilt
- Das Llama-3-GitHub-Repository erhielt mehr als 17.000 Sterne
- Im LMSYS Chatbot Arena Leaderboard belegte das Modell Llama 3 70B Instruct in der nur auf Englisch basierenden Bewertung den 1. Platz und insgesamt den 6. Platz, womit es unter den offen verfügbaren Modellen den höchsten Rang erreichte (hinter geschlossenen proprietären Modellen)

Frühe Anwendungsfälle von Llama 3

Partner aus den Bereichen Silizium, Hardware und Cloud-Bereitstellung haben begonnen, Llama 3 für Nutzer auszurollen
An der Yale School of Medicine wurde gemeinsam mit der EPFL School of Computer and Communication Sciences innerhalb von 24 Stunden nach dem Release von Llama 3 ein auf Llama 3 feinabgestimmtes Modell vorgestellt: Llama-3[8B]-MeditronV1.0, das erste Llama-3-8B-Modell für den medizinischen Bereich
- Dieses neue Modell übertraf bei Standard-Benchmarks wie MedQA und MedMCQA alle aktuellen offenen Modelle derselben Parameterklasse
- Weitere Details dazu, wie Yale und die EPFL die erste Version von Meditron auf Basis von Llama 2 aufgebaut haben, finden sich unter dem entsprechenden Link

Ausblick auf Llama 3

In den kommenden Monaten sollen Modelle mit neuen Funktionen veröffentlicht werden, darunter Multimodalität, mehrsprachige Gespräche, längere Kontextfenster und insgesamt verbesserte Fähigkeiten
Weitere Informationen sollen bald folgen, und man freut sich darauf, die nächste Welle communitygetriebener Innovationen zu sehen

3 Kommentare

gcback 2024-04-29

Die LLMs großer inländischer Unternehmen verlieren zunehmend an Wettbewerbsfähigkeit. Wenn eine Closed-Source-Strategie der Plan ist, sollten sie zumindest bei der Leistung ausreichend konkurrenzfähig sein; wenn die Strategie dagegen darin besteht, die Einsatzmöglichkeiten trotz geringerer Leistung zu erweitern, sollten sie nicht den Fokus auf Koreanisch in den Vordergrund stellen – derzeit machen sie jedoch genau das Gegenteil.

cosine20 2024-04-30

Im koreanischen Leaderboard wird nur bedeutungsloser Wettbewerb um Gewichte betrieben, damit Schlagzeilen gemacht und nebenbei der Aktienkurs gestützt, lol

2024-04-30

[Dieser Kommentar wurde ausgeblendet.]

Was in der ersten Woche nach der Ankündigung von Meta Llama 3 passiert ist

Frühe Anwendungsfälle von Llama 3

Ausblick auf Llama 3

Verwandte Beiträge

3 Kommentare