Sémantické vyhledávání
Vyhledávání podle významu textu, nikoliv podle přesné shody klíčových slov. Základ moderních RAG systémů.
Co je sémantické vyhledávání?
Sémantické vyhledávání (anglicky semantic search) hledá v textu podle významu, ne podle přesné shody slov. Na dotaz „Jak zrušit předplatné?" najde i dokument, který popisuje „ukončení platebního plánu". Klasické fulltextové vyhledávání by tento dokument minulo, protože neobsahuje slovo „zrušit" ani „předplatné".
Jak sémantické vyhledávání funguje
- Dokumenty se pomocí embedding modelu převedou na vektory a uloží do vektorové databáze.
- Dotaz uživatele se převede na vektor stejným modelem.
- Databáze najde vektory s nejbližší polohou (např. pomocí kosinové podobnosti) - tedy dokumenty s podobným významem.
Proč je sémantika lepší
- Zvládá synonyma, překlady a různé formulace
- Chápe kontext - „jablko" vs. značka Apple
- Funguje i u dotazů v přirozeném jazyce
- Je základem RAG systémů a moderních chatbotů
Limity sémantického vyhledávání
U krátkých, přesných dotazů (katalogová čísla, SKU, jména) může čisté sémantické hledání selhat. Řešením je hybrid search - kombinace sémantiky a klíčových slov, která zároveň často využívá re-ranking.