AI & Strojové učenieexpert

Čo je RAG (Retrieval-Augmented Generation)?

RAG je technika, ktorá vylepšuje odpovede jazykového modelu tým, že pred generovaním odpovede najprv vyhľadá relevantné informácie z externej databázy znalostí. Kombinuje silu vyhľadávania s generatívnou AI.

Definícia RAG (Retrieval-Augmented Generation)

Čo je RAG

RAG (Retrieval-Augmented Generation) je architektúra AI systémov, ktorá kombinuje dva prístupy: (1) vyhľadávanie relevantných dokumentov z databázy znalostí a (2) generovanie odpovede jazykovým modelom s použitím nájdených dokumentov ako kontextu.

Ako RAG funguje

Krok 1 — Indexovanie: Dokumenty (interné wiki, manuály, FAQ) sa rozrežú na menšie časti a prevedú na vektory (embeddings)
Krok 2 — Retrieval: Keď príde otázka, systém vyhľadá najrelevantnejšie časti dokumentov pomocou vektorovej podobnosti
Krok 3 — Augmentation: Nájdené dokumenty sa pridajú do promptu ako kontext
Krok 4 — Generation: LLM vygeneruje odpoveď na základe otázky aj nájdeného kontextu

Prečo RAG a nie len LLM

Samotný LLM má znalosti len z trénovacích dát — nepozná vaše interné dokumenty a jeho znalosti sú zastaralé. RAG rieši oba problémy: dodáva aktuálne, firemné dáta priamo do kontextu. Navyše znižuje halucinácie — model odpovedá na základe konkrétnych dokumentov, nie „z hlavy".

RAG sa stal štandardnou architektúrou pre firemné AI asistenty, interné chatboty, zákaznícku podporu a znalostné systémy. Nevyžaduje drahý fine-tuning a aktualizácia znalostí je jednoduchá — stačí pridať nové dokumenty do databázy.

Praktický príklad

Príklad: IT firma má 500 stránok internej dokumentácie. Nasadí RAG systém: dokumentácia sa indexuje do vektorovej databázy. Keď zamestnanec napíše chatbotu „Ako nakonfigurujem VPN pre vzdialený prístup?", systém nájde 3 najrelevantnejšie časti z interného manuálu a LLM z nich zostaví jasnú, krokovanú odpoveď s odkazom na zdrojový dokument. Zamestnanec dostane presnú odpoveď za 5 sekúnd namiesto 15 minút hľadania v dokumentácii.

Často kladené otázky

Čo je RAG v kontexte AI?

RAG (Retrieval-Augmented Generation) je technika, ktorá vylepšuje odpovede AI modelu tým, že najprv vyhľadá relevantné dokumenty z databázy a potom ich použije ako kontext pri generovaní odpovede.

Aký je rozdiel medzi RAG a fine-tuningom?

Fine-tuning mení parametre modelu (permanentne „naučí" nové informácie). RAG nemení model — dodáva mu relevantné dokumenty dynamicky pri každej otázke. RAG je flexibilnejší, lacnejší a jednoduchší na aktualizáciu.

Čo potrebujem na implementáciu RAG?

Potrebujete: (1) zdrojové dokumenty (knowledge base), (2) embedding model na prevod textu na vektory, (3) vektorovú databázu (Pinecone, Weaviate, ChromaDB), (4) LLM na generovanie odpovedí a (5) orchestráciu (LangChain, LlamaIndex).

Súvisiace pojmy

LLM (Veľký jazykový model)

LLM (Large Language Model) je typ AI modelu natrénovaný na obrovskom množstve textu, ktorý dokáže generovať, porozumieť a spracovávať ľudský jazyk. Medzi najznámejšie LLM patria GPT, Claude, Gemini a LLaMA.

Embeddings

Embeddings sú číselné reprezentácie (vektory) dát — slov, viet, obrázkov alebo iných objektov — v mnohorozmernom priestore. Podobné objekty majú blízke vektory, čo umožňuje strojom porozumieť vzťahom a podobnosti medzi dátami.

Vektorová databáza

Vektorová databáza je špecializovaný typ databázy optimalizovaný na ukladanie, indexovanie a vyhľadávanie vektorových embeddingov. Umožňuje rýchle vyhľadávanie podobnosti — nájdenie najblížších vektorov k zadanému dotazu.

Chatbot

Chatbot je softvérová aplikácia, ktorá simuluje ľudskú konverzáciu prostredníctvom textu alebo hlasu. Moderné AI chatboty využívajú veľké jazykové modely na generovanie prirodzených a kontextových odpovedí.

Prompt Engineering

Prompt engineering je umenie a veda formulovania textových pokynov (promptov) pre AI modely tak, aby generovali čo najkvalitnejšie a najrelevantnejšie výstupy. Správne formulovaný prompt dokáže dramaticky zlepšiť kvalitu odpovede.

Späť na slovník

Potrebujete pomôcť s webom?

Napíšte mi a poradím vám s vaším projektom. Prvá konzultácia je zadarmo a nezáväzná.

Napíšte mi Pozrite moju prácu