Vektorová databáze (Vector database)
Specializovaná databáze optimalizovaná pro ukládání a sémantické vyhledávání vektorů - číselných reprezentací textu.
Co je vektorová databáze?
Vektorová databáze je speciální typ databáze navržený pro ukládání a rychlé vyhledávání vektorů - číselných reprezentací textu vytvořených embedding modelem. Na rozdíl od klasických databází, které hledají přesnou shodu slov, vektorová databáze hledá podobnost významů.
Jak vektorová databáze funguje v RAG
- Indexace: Dokumenty se rozdělí na chunky, převedou na vektory a uloží do databáze.
- Dotaz: Uživatelova otázka se také převede na vektor.
- Vyhledávání: Databáze najde vektory (chunky), které jsou nejblíže vektoru otázky.
- Výsledek: Nejrelevantnější chunky se předají LLM pro generování odpovědi.
Populární vektorové databáze
- Pinecone - cloudová, spravovaná služba
- Qdrant - open-source, možnost self-hosted
- Weaviate - open-source s hybridním vyhledáváním
- Chroma - lehká, ideální pro lokální vývoj