9 Punkte von xguru 2024-02-22 | 1 Kommentare | Auf WhatsApp teilen
  • LlamaCloud: Ein verwalteter Parsing-, Ingestion- und Suchdienst der neuen Generation, konzipiert, um Context-Augmentation für LLM- und RAG-Anwendungen im Produktionseinsatz bereitzustellen
  • LlamaParse: Eine Technologie zum Parsen komplexer Dokumente mit Objekten wie Tabellen und Diagrammen. Durch die Integration mit LlamaIndex können Suchfunktionen für komplexe, semistrukturierte Dokumente aufgebaut werden
  • Managed Ingestion- und Retrieval-API: Bietet eine API, mit der Daten einfach geladen, verarbeitet und gespeichert werden können und die in jeder Sprache genutzt werden kann. Sie basiert auf LlamaHub, LlamaParse und einer integrierten Datenspeicherung

RAG hängt von der Qualität der Daten ab

  • Der Kern von LLM ist die Automatisierung von Wissenssuche, -synthese, -extraktion und -planung für unstrukturierte Datenquellen
  • Dafür ist ein neuer Datenstack entstanden: Retrieval-Augmented Generation (RAG), der Daten lädt, verarbeitet, in Vektordatenbanken einbettet und sie dort speichert
  • Der RAG-Stack unterscheidet sich vom klassischen ETL-Stack und hat direkten Einfluss auf die Genauigkeit von LLM-Systemen
  • Der Einstieg ist einfach, aber der Aufbau von produktionsreifen RAG-Systemen ist schwierig
    • Erzeugt keine zufriedenstellenden Ergebnisse
    • Es gibt zu viele Parameter zum Abstimmen
    • PDF-Dateien sind oft chaotisch formatiert und daher besonders problematisch
    • Die Synchronisierung von ständig aktualisierten Daten ist sehr schwierig
  • LlamaCloud und LlamaParse wurden als Datenpipelines aufgebaut, um RAG-Anwendungen schneller in den Produktiveinsatz zu bringen

LlamaParse

  • LlamaParse ist ein hochmodernes Parsing-Tool, das es ermöglicht, in komplexen PDF-Dokumenten enthaltene Tabellen und Diagramme für RAG zu interpretieren
  • Es ermöglicht die Beantwortung von Fragen zu komplexen Dokumenten, die mit früheren Ansätzen nicht möglich war

Managed Ingestion- und Retrieval-API

  • Als weiteres wichtiges Produkt von LlamaCloud können leistungsstarke Datenpipelines einfach definiert werden, um LLM-Anwendungen mit sauberen Daten zu versorgen
  • Es bietet Vorteile wie eingesparte Engineering-Zeit, bessere Leistung und reduzierte Systemkomplexität

Veröffentlichungspartner und Partner

  • LlamaParse arbeitet mit verschiedenen Partnern zusammen und baut im LLM- und KI-Ökosystem Daten-Stack-, Storage- und Rechenpartnerschaften mit Unternehmen wie MongoDB, Qdrant und NVIDIA auf

FAQ

  • LlamaCloud steht nicht im Wettbewerb mit Vektordatenbanken, sondern konzentriert sich auf Datenparsing und -ingestion. Es ist mit über 40 der beliebtesten Vektordatenbanken integriert
  • Die Suchebene ist eine Orchestrierung über bestehende Speichersysteme

Nächste Schritte

  • LlamaParse ist ab heute als öffentliche Vorschau verfügbar, während LlamaCloud als private Vorschau einer begrenzten Anzahl von Enterprise-Design-Partnern zur Verfügung steht

1 Kommentare

 
xguru 2024-02-22

Hacker News Kommentare

  • Als Mitglied des LlamaParse-Entwicklungsteams habe ich früher mehrere PDF-zu-strukturiertem-Text-Extraktoren entwickelt. LlamaParse hat im Vergleich zu anderen Extraktoren Verbesserungen: Es kombiniert OCR und die Textextraktion aus PDFs für die Texterfassung und mischt Heuristiken mit Machine-Learning-Modellen für die Dokumentrekonstruktion. In Kombination mit einer rekursiven Suchstrategie lassen sich bei Question-and-Answering für komplexe Texte die besten Ergebnisse erzielen.

  • LlamaParse hat einen sehr guten exklusiven Parsing-Service entwickelt, der PDFs mit komplexen Tabellen in ein gut strukturiertes Markdown-Format überführt. Ist es nicht ein Problem, dass Projektleiter nach dem Aufsehen und der Community-Beteiligung eines Open-Source-Projekts VC-Geld aufnehmen und etwas Exklusives daraus machen?

  • Ich verstehe nicht, warum es auf Medium veröffentlicht wurde. Medium ist kaum noch lesbar, also sollte es einen zugänglichen Blogbeitrag geben.

  • Ich frage mich, wie sich LlamaParse im direkten Vergleich zu unstructured.io schlägt.

  • Meine ersten Erfahrungen mit LlamaParse waren nicht besonders beeindruckend. Bei der Anmeldung per E-Mail gab es ein endloses Redirect-Problem, und nach der Anmeldung per Google war ich vom PDF-Parser enttäuscht. Es gibt schon viele Alternativen, und ich frage mich, warum dieser Service überhaupt nötig ist.

  • LlamaParse scheint ein schwieriges Problem angehen zu wollen. Viele Unternehmen müssen PDF-Dateien parsen und Daten präzise extrahieren. Die Oberfläche ist etwas verwirrend. LlamaParse kann Zahlen aus Tabellen extrahieren, aber die Ausgabe scheint nicht tabellarisch zu sein und man kann offenbar nur per Question-and-Answering auf die Zahlen zugreifen.

  • Ist das nicht ähnlich zu dem, was AWS Textract macht? Es kann ebenfalls Daten aus Tabellen und Formularen parsen und abfragen. LI macht das Suchprotokoll für Workflows und RAG für Nutzer einfacher, aber warum das Rad neu erfinden?

  • Wenn man LLMs nutzt, kann man Daten von Anfang an im passendsten Format extrahieren, also frage ich mich, warum man das aufbauen sollte. Kurzfristig kann es aus Kostengründen Sinn machen, langfristig ist das aber ein Problem, das LLMs grundsätzlich lösen können.

  • LlamaParse löst genau das Problem, das ich im Kontext von RAG immer wieder erlebt habe. Es ist schwierig, strukturierte Informationen aus unstrukturierten Daten zu gewinnen.

  • Wie wird die Preisgestaltung sein?