RAG (Retrieval-Augmented Generation)
Proces, kdy si AI nejdříve přečte vaše dokumenty a až pak odpoví uživateli.
Co je RAG?
RAG (Retrieval-Augmented Generation) se překládá do češtiny jako generování rozšířené o vyhledávání. Jedná se o techniku, díky které váš AI model „nehalucinuje" (nevymýšlí si), ale odpovědi generuje na základě znalostní databáze, kterou mu vy sami předložíte.
Jak RAG funguje
Běžný AI model je jako velmi vzdělaný člověk, který však od určitého data přestal sledovat novinky a nezná nic o vašem konkrétním byznysu. RAG tento problém řeší tak, že modelu v momentě dotazu předloží relevantní informace z vaší databáze.
- Příprava dat: Dokumenty se rozsekají na menší části a pomocí embedding modelu se převedou na vektory, které se uloží do vektorové databáze.
- Zpracování dotazu: Když se uživatel zeptá, systém převede dotaz na vektor a najde nejbližší kontextovou shodu v databázi.
- Generování odpovědi: Nalezené odstavce se přibalí k otázce a pošlou LLM modelu, který z nich sestaví finální odpověď.
Kdy se RAG hodí
- Interní znalostní báze - zaměstnanci se ptají systému místo procházení dokumentů
- Zákaznická podpora - chatbot odpovídající z vašich manuálů a FAQ
- Analýza dokumentů - rychlé hledání v právních smlouvách nebo technické dokumentaci