Hybrid search (hybridní vyhledávání)
Kombinace sémantického (vektorového) a klasického klíčového vyhledávání pro vyšší přesnost výsledků v RAG.
Co je hybrid search?
Hybrid search (hybridní vyhledávání) kombinuje dva typy vyhledávání: sémantické (vektorové) a klasické klíčové (fulltextové, např. BM25). Cílem je získat nejlepší výsledky z obou přístupů - sémantika chápe význam, klíčové hledání přesně zasáhne konkrétní slova, čísla nebo názvy.
Proč hybrid search
- Sémantika: Najde relevantní dokumenty, i když dotaz používá jiná slova než text ve vektorové databázi
- Klíčová slova: Přesně zasáhnou unikátní identifikátory - čísla produktů, jména, zkratky, kódy
- Kombinace skóre: Oba přístupy se sloučí (např. pomocí Reciprocal Rank Fusion) a výsledky se seřadí podle celkové relevance
Kdy hybrid search použít
- Vyhledávání v technické dokumentaci s čísly dílů a SKU
- Právní a lékařské texty plné specifických termínů
- E-commerce - kombinace vyhledávání podle popisu i podle kódu produktu
Hybrid search bývá dále doplněn o re-ranking, který z finálního výběru vybere nejvhodnější dokumenty pro LLM.