AI & Strojové učenieexpert

Čo je RAG (Retrieval-Augmented Generation)?

RAG je technika, ktorá vylepšuje odpovede jazykového modelu tým, že pred generovaním odpovede najprv vyhľadá relevantné informácie z externej databázy znalostí. Kombinuje silu vyhľadávania s generatívnou AI.

Definícia RAG (Retrieval-Augmented Generation)

Čo je RAG

RAG (Retrieval-Augmented Generation) je architektúra AI systémov, ktorá kombinuje dva prístupy: (1) vyhľadávanie relevantných dokumentov z databázy znalostí a (2) generovanie odpovede jazykovým modelom s použitím nájdených dokumentov ako kontextu.

Ako RAG funguje

  • Krok 1 — Indexovanie: Dokumenty (interné wiki, manuály, FAQ) sa rozrežú na menšie časti a prevedú na vektory (embeddings)
  • Krok 2 — Retrieval: Keď príde otázka, systém vyhľadá najrelevantnejšie časti dokumentov pomocou vektorovej podobnosti
  • Krok 3 — Augmentation: Nájdené dokumenty sa pridajú do promptu ako kontext
  • Krok 4 — Generation: LLM vygeneruje odpoveď na základe otázky aj nájdeného kontextu

Prečo RAG a nie len LLM

Samotný LLM má znalosti len z trénovacích dát — nepozná vaše interné dokumenty a jeho znalosti sú zastaralé. RAG rieši oba problémy: dodáva aktuálne, firemné dáta priamo do kontextu. Navyše znižuje halucinácie — model odpovedá na základe konkrétnych dokumentov, nie „z hlavy".

RAG sa stal štandardnou architektúrou pre firemné AI asistenty, interné chatboty, zákaznícku podporu a znalostné systémy. Nevyžaduje drahý fine-tuning a aktualizácia znalostí je jednoduchá — stačí pridať nové dokumenty do databázy.

Praktický príklad

Príklad: IT firma má 500 stránok internej dokumentácie. Nasadí RAG systém: dokumentácia sa indexuje do vektorovej databázy. Keď zamestnanec napíše chatbotu „Ako nakonfigurujem VPN pre vzdialený prístup?", systém nájde 3 najrelevantnejšie časti z interného manuálu a LLM z nich zostaví jasnú, krokovanú odpoveď s odkazom na zdrojový dokument. Zamestnanec dostane presnú odpoveď za 5 sekúnd namiesto 15 minút hľadania v dokumentácii.

Často kladené otázky

Čo je RAG v kontexte AI?

RAG (Retrieval-Augmented Generation) je technika, ktorá vylepšuje odpovede AI modelu tým, že najprv vyhľadá relevantné dokumenty z databázy a potom ich použije ako kontext pri generovaní odpovede.

Aký je rozdiel medzi RAG a fine-tuningom?

Fine-tuning mení parametre modelu (permanentne „naučí" nové informácie). RAG nemení model — dodáva mu relevantné dokumenty dynamicky pri každej otázke. RAG je flexibilnejší, lacnejší a jednoduchší na aktualizáciu.

Čo potrebujem na implementáciu RAG?

Potrebujete: (1) zdrojové dokumenty (knowledge base), (2) embedding model na prevod textu na vektory, (3) vektorovú databázu (Pinecone, Weaviate, ChromaDB), (4) LLM na generovanie odpovedí a (5) orchestráciu (LangChain, LlamaIndex).

Súvisiace pojmy

Potrebujete pomôcť s webom?

Napíšte mi a poradím vám s vaším projektom. Prvá konzultácia je zadarmo a nezáväzná.