GPTCache – Eine Bibliothek zum Caching von Antworten auf LLM-Anfragen

xguru · 2023-04-24T10:03:05+09:00

Antworten von LLMs werden gecacht, um die LLM-Kosten einer Organisation zu senken und die Antwortgeschwindigkeit zu erhöhen Durch eine semantische Caching-Strategie werden ähnliche oder verwandte Anfragen gefunden, um die Cache-Trefferquote zu erhöhen Anfragen werden mithilfe von Embedding-Algorithmen in Embeddings umgewandelt, und über einen Vector Store wird eine Ähnlichkeitssuche für diese Embeddings durchgeführt LLM Adapter: Unterstützung für OpenAI ChatGPT und LangChain (Support für Bard/Anthropic/LLaMA usw. ist ebenfalls geplant) MultiModal Adapter: OpenAI Image Create, OpenAI Audio Transribe, HuggingFace Stable Diffusion Embedding Generator: OpenAI, ONNX, HuggingFace, Cohere, fastText, SentenceTransformers Cache Storage: SQLite, PostgreSQL, MySQL, SQLServer,.. Vector Store: Mulvus, Zilliz Cloud, FAISS, Hnswlib Cache Manager: LRU, FIFO

(github.com/zilliztech)

13 Punkte von xguru 2023-04-24 | Noch keine Kommentare. | Auf WhatsApp teilen

Antworten von LLMs werden gecacht, um die LLM-Kosten einer Organisation zu senken und die Antwortgeschwindigkeit zu erhöhen
Durch eine semantische Caching-Strategie werden ähnliche oder verwandte Anfragen gefunden, um die Cache-Trefferquote zu erhöhen
- Anfragen werden mithilfe von Embedding-Algorithmen in Embeddings umgewandelt, und über einen Vector Store wird eine Ähnlichkeitssuche für diese Embeddings durchgeführt
LLM Adapter: Unterstützung für OpenAI ChatGPT und LangChain (Support für Bard/Anthropic/LLaMA usw. ist ebenfalls geplant)
MultiModal Adapter: OpenAI Image Create, OpenAI Audio Transribe, HuggingFace Stable Diffusion
Embedding Generator: OpenAI, ONNX, HuggingFace, Cohere, fastText, SentenceTransformers
Cache Storage: SQLite, PostgreSQL, MySQL, SQLServer,..
Vector Store: Mulvus, Zilliz Cloud, FAISS, Hnswlib
Cache Manager: LRU, FIFO

GPTCache – Eine Bibliothek zum Caching von Antworten auf LLM-Anfragen

Verwandte Beiträge

Noch keine Kommentare.