Čo je RAG (Retrieval-Augmented Generation)?
RAG je technika, ktorá vylepšuje odpovede jazykového modelu tým, že pred generovaním odpovede najprv vyhľadá relevantné informácie z externej databázy znalostí. Kombinuje silu vyhľadávania s generatívnou AI.
Definícia RAG (Retrieval-Augmented Generation)
Čo je RAG
RAG (Retrieval-Augmented Generation) je architektúra AI systémov, ktorá kombinuje dva prístupy: (1) vyhľadávanie relevantných dokumentov z databázy znalostí a (2) generovanie odpovede jazykovým modelom s použitím nájdených dokumentov ako kontextu.
Ako RAG funguje
- Krok 1 — Indexovanie: Dokumenty (interné wiki, manuály, FAQ) sa rozrežú na menšie časti a prevedú na vektory (embeddings)
- Krok 2 — Retrieval: Keď príde otázka, systém vyhľadá najrelevantnejšie časti dokumentov pomocou vektorovej podobnosti
- Krok 3 — Augmentation: Nájdené dokumenty sa pridajú do promptu ako kontext
- Krok 4 — Generation: LLM vygeneruje odpoveď na základe otázky aj nájdeného kontextu
Prečo RAG a nie len LLM
Samotný LLM má znalosti len z trénovacích dát — nepozná vaše interné dokumenty a jeho znalosti sú zastaralé. RAG rieši oba problémy: dodáva aktuálne, firemné dáta priamo do kontextu. Navyše znižuje halucinácie — model odpovedá na základe konkrétnych dokumentov, nie „z hlavy".
RAG sa stal štandardnou architektúrou pre firemné AI asistenty, interné chatboty, zákaznícku podporu a znalostné systémy. Nevyžaduje drahý fine-tuning a aktualizácia znalostí je jednoduchá — stačí pridať nové dokumenty do databázy.
Praktický príklad
Príklad: IT firma má 500 stránok internej dokumentácie. Nasadí RAG systém: dokumentácia sa indexuje do vektorovej databázy. Keď zamestnanec napíše chatbotu „Ako nakonfigurujem VPN pre vzdialený prístup?", systém nájde 3 najrelevantnejšie časti z interného manuálu a LLM z nich zostaví jasnú, krokovanú odpoveď s odkazom na zdrojový dokument. Zamestnanec dostane presnú odpoveď za 5 sekúnd namiesto 15 minút hľadania v dokumentácii.
Často kladené otázky
Čo je RAG v kontexte AI?
RAG (Retrieval-Augmented Generation) je technika, ktorá vylepšuje odpovede AI modelu tým, že najprv vyhľadá relevantné dokumenty z databázy a potom ich použije ako kontext pri generovaní odpovede.
Aký je rozdiel medzi RAG a fine-tuningom?
Fine-tuning mení parametre modelu (permanentne „naučí" nové informácie). RAG nemení model — dodáva mu relevantné dokumenty dynamicky pri každej otázke. RAG je flexibilnejší, lacnejší a jednoduchší na aktualizáciu.
Čo potrebujem na implementáciu RAG?
Potrebujete: (1) zdrojové dokumenty (knowledge base), (2) embedding model na prevod textu na vektory, (3) vektorovú databázu (Pinecone, Weaviate, ChromaDB), (4) LLM na generovanie odpovedí a (5) orchestráciu (LangChain, LlamaIndex).
Súvisiace pojmy
Potrebujete pomôcť s webom?
Napíšte mi a poradím vám s vaším projektom. Prvá konzultácia je zadarmo a nezáväzná.