AI & Strojové učenieexpert

Čo je Vektorová databáza?

Vektorová databáza je špecializovaný typ databázy optimalizovaný na ukladanie, indexovanie a vyhľadávanie vektorových embeddingov. Umožňuje rýchle vyhľadávanie podobnosti — nájdenie najblížších vektorov k zadanému dotazu.

Definícia Vektorová databáza

Čo je vektorová databáza

Vektorová databáza je databázový systém navrhnutý na efektívnu prácu s vysokorozmernými vektormi (embeddingami). Na rozdiel od relačných databáz (PostgreSQL, MySQL), ktoré vyhľadávajú podľa presných hodnôt, vektorové databázy vyhľadávajú podľa podobnosti — nájdu vektory, ktoré sú najbližšie k zadanému dotazu.

Populárne vektorové databázy

  • Pinecone — plne spravovaná cloudová služba, jednoduchá integrácia
  • Weaviate — open-source, podporuje hybrid search (vektory + kľúčové slová)
  • ChromaDB — ľahký, open-source, ideálny na prototypovanie
  • Milvus — open-source, škálovateľný na miliardy vektorov
  • pgvector — rozšírenie pre PostgreSQL, umožňuje vektorové vyhľadávanie v existujúcej databáze

Ako vyhľadávanie funguje

Vektorová databáza používa algoritmy aproximovaného najbližšieho suseda (ANN — Approximate Nearest Neighbor) ako HNSW alebo IVF. Tieto algoritmy vyhľadávajú medzi miliónmi vektorov za milisekundy. Presnosť vyhľadávania sa meria metrikami ako recall@k a väčšina databáz dosahuje 95-99% presnosť.

Vektorové databázy sú kľúčovým komponentom RAG architektúr, odporúčacích systémov, sémantického vyhľadávania a detekcie duplikátov. S rastúcim nasadením AI sa stali jednou z najrýchlejšie rastúcich kategórií databázového softvéru.

Praktický príklad

Príklad: Módny e-shop implementuje vizuálne vyhľadávanie: zákazník nahrá fotografiu šiat, ktoré videl na ulici. Systém prevedie fotografiu na embedding pomocou CLIP modelu a vyhľadá v Pinecone databáze 10 najbližších vektorov. Za 50 milisekúnd zobrazí 10 vizuálne najpodobnejších produktov z katalógu — šaty s podobným strihom, farbou a vzorkou, aj keď sa líšia značkou a cenou.

Často kladené otázky

Čo je vektorová databáza?

Vektorová databáza je špeciálny typ databázy na ukladanie a vyhľadávanie vektorov (embeddingov). Namiesto vyhľadávania podľa presných hodnôt hľadá najbližšie — najvpodobnejšie — vektory k vášmu dotazu.

Kedy potrebujem vektorovú databázu?

Keď budujete RAG systém (firemný chatbot s vlastnými dokumentmi), sémantické vyhľadávanie, odporúčací systém, vizuálne vyhľadávanie obrázkov alebo detekciu duplikátov.

Môžem použiť PostgreSQL namiesto vektorovej databázy?

Áno, s rozšírením pgvector. Pre menšie projekty (do miliónov vektorov) je to výborná voľba, pretože nemusíte prevádzkovať samostatný systém. Pre väčšie objemy sú špecializované vektorové databázy efektívnejšie.

Súvisiace pojmy

Potrebujete pomôcť s webom?

Napíšte mi a poradím vám s vaším projektom. Prvá konzultácia je zadarmo a nezáväzná.