- Ein aktueller Artikel der MIT Technology Review stellt die Idee vor, lokale LLMs mit einer Offline-Backup-Version von Wikipedia zu vergleichen
- Die Dateigrößen wichtiger LLM-Modelle aus der Ollama-Bibliothek werden direkt mit den von Kiwix bereitgestellten Offline-Wikipedia-Bundles verglichen
- LLM-Dateien und Wikipedia-Daten unterscheiden sich in Zweck, Stärken und Schwächen, daher ist ein einfacher Vergleich schwierig, doch bei der Speicherkapazität zeigen sich interessante Unterschiede
- Einige LLMs (Modelle mit 1–4 GB) sind größer als die einfache englische Wikipedia (ca. 1 GB), während die vollständige Wikipedia (57 GB) größer ist als große LLMs (20–32 GB)
- Neben der Dateigröße müssen praktische Faktoren wie Arbeitsspeicher- und CPU-Anforderungen berücksichtigt werden; je nach tatsächlichem Einsatzzweck kann die Wahl unterschiedlich ausfallen
Vergleich zwischen lokalen LLMs und Offline-Wikipedia
Einleitung und Anlass des Vergleichs
- Die MIT Technology Review stellte kürzlich den Artikel "How to run an LLM on your laptop" vor
- Der Artikel betont, dass sich durch die lokale Ausführung eines LLMs auch in einer Offline-Umgebung Wissen nutzen lässt
- Eindrucksvoll ist Simon Willisons Vergleich, dass ein Offline-LLM wie eine zusammengefasste, unvollständige Version von Wikipedia sei und in einer apokalyptischen Situation mit nur einem USB-Stick beim Neustart der Gesellschaft helfen könne
Vergleich von Modell- und Datengrößen
- Verglichen werden mehrere LLM-Modelle aus der Ollama-Bibliothek mit den Dateigrößen der von Kiwix angebotenen Offline-Wikipedia-Bundles
- Für den Vergleich wurden Modelle berücksichtigt, die auf typischer Consumer-Hardware lauffähig sind, sowie Wikipedia-Daten ohne Bilder
- Die wichtigsten Vergleichsergebnisse sind wie folgt:
- Kleinste Zusammenfassungen
- Best of Wikipedia (Top 50.000, Zusammenfassung): 356.9MB
- Simple English Wikipedia (Zusammenfassung): 417.5MB
- Repräsentative LLM-Modelle (klein)
- Qwen 3 0.6B: 523MB
- Deepseek-R1 1.5B: 1.1GB
- Llama 3.2 1B: 1.3GB
- Repräsentative LLM-Modelle (mittel bis groß)
- Deepseek-R1 8B / Qwen 3 8B: 5.2GB
- Gemma3n e4B: 7.5GB
- Deepseek-R1 14B: 9GB
- Qwen 3 14B: 9.3GB
- Gesamte Wikipedia
- Wikipedia (vollständig): 57.18GB
- Die Top 50.000 Wikipedia-Artikel sind mit 356.9MB sehr klein
- Das kleinste LLM (0.6B, Qwen) ist mit 523MB größer als eine einfache Wikipedia-Zusammenfassung
- Die vollständige Wikipedia (57.18GB) ist deutlich größer als das größte LLM (20GB)
Grenzen des Vergleichs und wichtige Überlegungen
- Ein direkter Vergleich ist schwierig: Eine Enzyklopädie (Daten) und ein LLM (generatives Modell) unterscheiden sich grundlegend in Zweck und Struktur
- Nicht nur die Dateigröße ist wichtig: LLMs benötigen zusätzlich zur Dateigröße beim Ausführen oft viel Arbeitsspeicher und CPU-Ressourcen. Offline-Wikipedia lässt sich auf schwächerer Hardware leichter betreiben
- Nutzen je nach konkretem Einsatzzweck: So kann man zum Beispiel nur den Bereich Chemie herunterladen oder ein für bestimmte Hardware optimiertes LLM verwenden
- Subjektivität der Auswahlkriterien: Die Auswahl der für den Vergleich verwendeten Elemente ist subjektiv
Fazit und Implikationen
- Die Top 50.000 Wikipedia-Artikel und das Llama-3.2-3B-Modell liegen bei der Dateigröße auf ähnlichem Niveau
- Die kleinsten Wikipedia-Bundles sind sogar kleiner als das kleinste LLM, während die vollständige Wikipedia-Datei größer als das größte LLM ist
- In einer Umgebung mit ausreichend Speicherplatz kann es sinnvoll sein, sowohl LLMs als auch Wikipedia-Daten herunterzuladen und gemeinsam zu nutzen
1 Kommentare
Hacker-News-Kommentare
gpgkeywar perhttpangegeben, womit die Sicherheit ausgehebelt wurde.wikipedia_en_all_maxi_2024-01.zimherunter. Ich will mit libzim Seiten extrahieren und an ein LLM anbinden. Die zim-Datei speichert Seiten als HTML und ist etwa 100 GB groß. Der Grund ist, dass ich eine riesige, auf HDD gespeicherte Liste von Spielen habe — nur Titel, ohne gesonderte Kategorien — und sie mit Wikipedia-Artikeln abgleichen will, um sie nach Genre oder anderen Informationen zu ordnen. In Experimenten hat ein LLM (Mistral Small 3.2 quantized) überraschend gut Ordnung in das Chaos gebracht. Mit llama.cpp lässt sich das in einem Custom-Skript schnell betreiben.