RAG (Retrieval-Augmented Generation)

Proces, kdy si AI nejdříve přečte vaše dokumenty a až pak odpoví uživateli.

Co je RAG?

RAG (Retrieval-Augmented Generation) se překládá do češtiny jako generování rozšířené o vyhledávání. Jedná se o techniku, díky které váš AI model „nehalucinuje" (nevymýšlí si), ale odpovědi generuje na základě znalostní databáze, kterou mu vy sami předložíte.

Jak RAG funguje

Běžný AI model je jako velmi vzdělaný člověk, který však od určitého data přestal sledovat novinky a nezná nic o vašem konkrétním byznysu. RAG tento problém řeší tak, že modelu v momentě dotazu předloží relevantní informace z vaší databáze.

Příprava dat: Dokumenty se rozsekají na menší části a pomocí embedding modelu se převedou na vektory, které se uloží do vektorové databáze.
Zpracování dotazu: Když se uživatel zeptá, systém převede dotaz na vektor a najde nejbližší kontextovou shodu v databázi.
Generování odpovědi: Nalezené odstavce se přibalí k otázce a pošlou LLM modelu, který z nich sestaví finální odpověď.

Kdy se RAG hodí

Interní znalostní báze - zaměstnanci se ptají systému místo procházení dokumentů
Zákaznická podpora - chatbot odpovídající z vašich manuálů a FAQ
Analýza dokumentů - rychlé hledání v právních smlouvách nebo technické dokumentaci

🍪 Pár slov o cookies

RAG (Retrieval-Augmented Generation)

Co je RAG?

Jak RAG funguje

Kdy se RAG hodí