데이터가 이미 사는 곳에서 vector 유사도
pgvector extension 이 PostgreSQL 에 vector 데이터 타입과 유사도 연산자 (<-> L2, <#> 내적, <=> 코사인) 추가. ANN 인덱스 (HNSW, IVFFlat) 가 별도 vector DB 없이 수백만 vector 검색 실용적으로.
pgvector AI feature 모양
- 각 행에 임베딩 생성 (OpenAI, Cohere, 로컬 모델 — 선택).
- 같은 행의
vector(N)컬럼에 저장. - 빠른 approximate nearest neighbor 위한 HNSW 인덱스 추가.
- 쿼리: "이 쿼리 임베딩에 가장 가까운 5 행 찾기."
맞는 답인 때
단일 Postgres 인스턴스로 약 1천만 vector 까지, pgvector 가 dedicated vector DB 보다 운영적으로 단순 + 임베딩을 relational 데이터와 함께 쿼리하는 기쁨. 그 스케일 넘어가면 dedicated vector store (Pinecone, Weaviate, Qdrant) 가 절대 처리량에서 이김.