- Leistungsstarkes KI-basiertes Forschungstool, das mehrere LLMs und Websuche für tiefgehende iterative Analysen nutzt
- Integriert Suchfunktionen für ArXiv, Wikipedia, Google, PubMed, DuckDuckGo, SerpAPI, lokales RAG, The Guardian und mehr
- Kann lokal ausgeführt werden, um den Datenschutz zu verbessern, oder mit Cloud-basierten LLMs konfiguriert werden, um die Leistung zu steigern
Erweiterte Forschungsfunktionen
- Automatisierte Tiefenrecherche: Generiert intelligente Folgefragen
- Quellenverfolgung und Verifizierung: Automatische Nachverfolgung von Zitaten und Quellen
- Iterative Analyse: Mehrstufige iterative Analyse für umfassende Abdeckung
- Analyse ganzer Webseiteninhalte: Analyse auf Basis vollständiger Inhalte statt nur von Snippets
Flexible LLM-Unterstützung
- Unterstützung lokaler Modelle: Lokale KI-Verarbeitung auf Basis von Ollama
- Unterstützung von Cloud-Modellen: Unterstützung für Cloud-LLMs wie Claude und GPT
- Kompatibilität mit Langchain-Modellen: Unterstützung für verschiedene Langchain-Modelle
- Modellauswahl möglich: Modelle können je nach Leistung, Antwortgeschwindigkeit usw. konfiguriert werden
Vielfältige Ausgabeoptionen
- Detaillierte Forschungsergebnisse: Ausführliche Berichte mit Zitaten
- Umfassender Forschungsbericht: Liefert umfassende Forschungsergebnisse
- Schnelle Zusammenfassung: Zentrale Inhalte lassen sich kompakt zusammenfassen
- Quellenverfolgung und Verifizierung: Unterstützung bei Quellenverfolgung und Verifizierung
Datenschutzorientiertes Design
- Lokal ausführbar: Bei Verwendung lokaler Modelle bleiben alle Daten auf dem Gerät des Nutzers
- Konfigurierbare Suche: Verbessert den Datenschutz
- Transparente Datenverarbeitung: Legt die Datenverarbeitung klar offen
Verbesserte Suchintegration
- Automatische Auswahl der Suchmaschine: Wählt die Suchmaschine je nach Inhalt der Anfrage automatisch aus
- Wikipedia-Integration: Suche nach verlässlichen Fakten
- arXiv-Integration: Suche nach wissenschaftlichen Arbeiten und Forschung
- PubMed-Integration: Suche nach medizinischen und biomedizinischen Forschungsquellen
- DuckDuckGo-Integration: Allgemeine Websuche (mögliche Ratenbegrenzung)
- SerpAPI-Integration: Liefert Google-Suchergebnisse (API-Schlüssel erforderlich)
- Google Programmable Search: Benutzerdefinierte Sucheinstellungen (API-Schlüssel erforderlich)
- The Guardian-Integration: Suche nach Nachrichten- und journalistischen Inhalten (API-Schlüssel erforderlich)
- Lokale RAG-Suche: Suche in persönlichen Dokumenten möglich (mit Vektor-Embeddings)
- Suche über vollständige Webseiteninhalte: Durchsucht den kompletten Inhalt von Webseiten
- Quellenfilterung und Verifizierung: Kann auf vertrauenswürdige Quellen filtern
- Konfigurierbare Suchparameter: Suchbereich, Zeitraum usw. können festgelegt werden
Lokale Dokumentensuche (RAG)
- Suche auf Basis von Vektor-Embeddings: Inhalte in persönlichen Dokumenten durchsuchbar
- Erstellung benutzerdefinierter Dokumentensammlungen: Dokumente können thematisch gruppiert werden
- Datenschutz: Alle Dokumente werden lokal verarbeitet
- Intelligentes Chunking und Suche: Dokumentinhalte werden segmentiert und durchsucht
- Kompatibel mit verschiedenen Dokumentformaten: Unterstützt PDF, Text, Markdown usw.
- Automatische Anwendung integrierter Metasuche: Lokale und Websuche können kombiniert werden
Weboberfläche
- Dashboard verfügbar: Intuitive Benutzeroberfläche
- Echtzeit-Updates zum Fortschritt: Zeigt den Forschungsfortschritt in Echtzeit an
- Verwaltung des Forschungsverlaufs: Zugriff auf und Verwaltung früherer Recherchen
- Export von PDF-Berichten: Forschungsberichte können als PDF heruntergeladen werden
- Forschungsverwaltung: Laufende Recherchen können gestoppt oder gelöscht werden
Unterstützte Optionen für Suchmaschinen
- Auto: Automatische Auswahl der Engine je nach Anfrage
- Wikipedia: Geeignet für allgemeine Informationen und Faktensuche
- arXiv: Geeignet für wissenschaftliche und akademische Arbeiten
- PubMed: Geeignet für biomedizinische und medizinische Forschung
- DuckDuckGo: Datenschutzorientierte allgemeine Websuche
- The Guardian: Nachrichten- und journalistische Suche (API-Schlüssel erforderlich)
- SerpAPI: Liefert Google-Suchergebnisse (API-Schlüssel erforderlich)
- Google Programmable Search: Benutzerdefinierte Suche (API-Schlüssel erforderlich)
4 Kommentare
neue Technologienzu formulieren. Insbesondere wird versucht, einen Bezug zu AI herzustellen.In der Config-Datei lassen sich verschiedene Einstellungen vornehmen. Man kann die zu durchsuchende Datenbank auf PubMed beschränken und so die Qualität der Materialien weiter erhöhen. Außerdem kann man festlegen, wie viele Texte auf einmal durchsucht werden und wie viele Chunks bei der Nutzung von RAG erstellt werden sollen.
Wenn man berücksichtigt, dass es sich derzeit um Version 0.01V handelt, ist es äußerst beeindruckend, dass sich auf einer lokalen Maschine Berichte in diesem Umfang erzeugen lassen. Gerade im Bereich Life Sciences verwenden Chatbots oft
verallgemeinernde Beschreibungen, aber die mit diesem Programm erstellten Berichte nutzen eine sehr wissenschaftliche Ausdrucksweise.Das Programm unterstützt derzeit kein Koreanisch. Selbst wenn man Fragen auf Koreanisch stellt, wird der Bericht auf Englisch ausgegeben.
Außerdem gibt es beim Export als PDF das Problem, dass Koreanisch in der PDF-Datei nicht angezeigt wird.
Wenn nur das Problem gelöst wird, dass Refs während der Berichterstellung verschwinden, sowie das Halluzinationsproblem, halte ich es für ein wirklich leistungsstarkes Werkzeug.
Nach weiterer Nutzung scheint es in Ollama unter den verschiedenen Modellen besonders mit Qwen2.5 gut zu funktionieren. Deepseek-r1 erzeugt bei der Suche merkwürdige Abfragen, sodass es die als Beleg dienenden Inhalte falsch abruft, und die Gemma-Modelle interpretieren den als Beispiel genannten Prompt als tatsächlichen Prompt und versuchen, Inhalte zu genau diesem verwandten Thema unbedingt einzufügen.
Hacker-News-Kommentare
Applaus für die Bemühungen um einen lokalen und Low-Fidelity-Bereich. Nach dem Lesen der Beispiele im Dokument wirken die Ergebnisse allerdings etwas verwirrend
Dieses Projekt ist großartig
Ich habe es ausprobiert, aber es traten viele Fehler auf, sodass ich keinen Bericht erstellen konnte. Es gibt keine Möglichkeit, nach einem Fehlschlag fortzusetzen, daher muss man bei einem fehlgeschlagenen API-Aufruf wieder ganz von vorn beginnen
Für die Websuche sollte man auch die APIs von Kagi und Tavily in Betracht ziehen
Sieht sehr cool aus. Ich frage mich, wie es sich mit der RAG-Funktion von open-webui vergleichen lässt
Ich frage mich, ob jemand mit einem (lokalen) LLM direkt in einer Materialsammlung nach relevanten Informationen sucht, ohne sich auf Vektorsuche zu verlassen
Gute Arbeit
Ich frage mich, ob es ein Tool gibt, das eine AI-Sucherfahrung bietet und den Inhalt von Bookmarks mischt, um einen Bericht zu erzeugen. Meine Bookmarks sind derzeit nutzlos. Das könnte sie nützlich machen
Ich denke, wer eine GUI wie ein 3D-Spiel für LLMs baut, wird der nächste Jobs/Gates/Musk und Nobelpreisträger sein. Das würde Millionen Menschen einen Blick ins Innere von LLMs ermöglichen und damit das Alignment-Problem lösen. Computer wurden erst mit dem Aufkommen von Betriebssystemen mit GUI massentauglich, und die heutigen Chatbots ähneln der Kommandozeile. Ich habe ASK HN gestartet, um Ideen zur AI-Sicherheit zu teilen
Nicht nachvollziehbar. Das hat nicht einmal das Coding-Niveau eines Grundschülers, geschweige denn akademisches Niveau — warum teilt man so etwas überhaupt ...