- Text-Embedding-Modell
jina-embeddings-v2 mit Unterstützung für eine Token-Länge von 8192
- Tritt gegen OpenAIs
text-embedding-ada-002 an und zeigt in Benchmarks bessere Leistung bei Klassifizierung, Re-Ranking, Suche und Zusammenfassung
- Von Grund auf neu entwickelt und dank 8k-Kontext in vielen Bereichen einsetzbar: Analyse juristischer Dokumente, medizinische Forschung, Literaturanalyse, Finanzprognosen, dialogorientierte KI usw.
- Auf HuggingFace stehen zwei Modelle zum Download bereit
- Base Model (0.27G): Entwickelt für anspruchsvolle Aufgaben mit hoher Genauigkeit, etwa akademische Forschung oder Business-Analyse
- Small Model (0.07G): Für schlanke Anwendungen wie mobile Apps oder Geräte mit begrenzten Rechenressourcen
1 Kommentare
Hacker-News-Kommentare
text-embedding-ada-002(768 statt 1536), was Datenbankspeicher spart und Abfragen beschleunigen kann.transformers.jsdie Dateigröße um das Vierfache reduziert.llm-embed-jina-Plugin wurde für das LLM-Tool bereitgestellt und ermöglicht den Zugriff auf das neue Jina-Modell.