C.W.K.
Stream
← C.W.K. Quests
🧮

Vector Quest

최근 수정: 2026-05-04

키워드에서 임베딩, 그리고 프로덕션에서 신뢰할 수 있는 메모리 시스템까지

프로덕션에서 살아남는 시맨틱 retrieval 빌드: 청킹, ChromaDB, pgvector, 하이브리드 검색, RAG, operations, AI 메모리 시스템.

8 tracks · 41 lessons · ~32h · difficulty: beginner-to-advanced

Level 0Scout
0 XP0/41 lessons0/10 achievements
0/120 XP to next level120 XP to go0% complete
Vector Quest 는 모던 retrieval 스택의 hands-on 투어야. 키워드 검색을 임베딩으로 교체하면서 시작, retrieval 품질 결정하는 청킹 + 메타데이터 discipline 배우고, 작동하는 ChromaDB store ship. 거기서 SQL-native 배포의 pgvector, BM25 + RRF + cross-encoder reranking 의 하이브리드 검색, RAG 아키텍처 (인용, prompt assembly, 안 쓸 때), 프로덕션 ops (비용, latency, versioning, observability, multi-tenant isolation), 그리고 cwkPippa 자체의 메모리-시스템 패턴으로 마무리. 모든 레슨이 실행 가능한 코드 ship; 모든 트랙이 개념 박는 quiz 로 끝남.

Tracks

  1. 01🧭왜 벡터 검색? 기초

    0/6 lessons

    의미는 키워드가 아니라 좌표야

    텍스트가 벡터가 되고, 벡터는 어떤 공간에 살고, 유사도는 각도와 거리로 잰다. 이 트랙 끝나면 NumPy로 직접 시맨틱 서치 짤 수 있고 거리 메트릭 골랐는지 답할 수 있어.

    Lesson list (6)퀴즈 · 4 문제
  2. 02🧩청킹과 인제스트

    0/5 lessons

    어떻게 자르냐가 뭘 찾을 수 있는지를 결정해

    청킹은 RAG 품질에서 제일 저평가된 레버야. 청크 크기나 splitter 잘못 고르면 세계 최고 임베딩 모델도 구해줄 수 없어. 이 트랙은 토큰-aware splitter, 구조-aware splitter, 그리고 청크를 source 로 만드는 메타데이터까지.

    Lesson list (5)퀴즈 · 4 문제
  3. 03🌈ChromaDB 실전

    0/5 lessons

    cwkPippa 가 실제로 돌리는 vector store

    Chroma 는 진지한 vector store 중 띄우기가 가장 쉬운 거 — pip install, 디스크 영속, 끝. 이 트랙은 100번씩 돌리게 될 operation: create, add, query, filter, update, delete, backup.

    Lesson list (5)퀴즈 · 4 문제
  4. 04🐘pgvector 와 SQL 하이브리드

    0/5 lessons

    벡터가 관련 데이터 옆에 살아야 할 때

    pgvector 가 Postgres 를 신뢰할만한 vector store 로 변환. win 은 locality — describing rows 옆에 벡터, transaction, join, 두 개 대신 한 operational target. 이 트랙은 설치, 인덱스, 하이브리드 query, 안전한 마이그레이션 path.

    Lesson list (5)퀴즈 · 4 문제
  5. 05🔀하이브리드 검색과 Reranking

    0/5 lessons

    벡터 + 키워드 + cross-encoder, 그 순서로

    순수 벡터 검색은 exact-match query (제품 코드, 에러 string, 이름) 을 놓침. 순수 키워드 검색은 paraphrase 를 놓침. 하이브리드 시스템은 둘 다 결합 + 위에 reranker. 이 트랙이 스택 조립법 + 진짜 도움 되는지 측정법.

    Lesson list (5)퀴즈 · 4 문제
  6. 06📚RAG 시스템 디자인

    0/5 lessons

    retrieval 결과에서 grounded LLM 답까지

    Retrieval-Augmented Generation 이 사적 데이터 위 LLM 앱 빌드의 dominant 패턴. 이 트랙은 retrieval 과 generation 의 contract, prompt assembly, 인용, RAG 가 잘못된 답인 경우.

    Lesson list (5)퀴즈 · 4 문제
  7. 07⚙️프로덕션 Operations

    0/5 lessons

    비용, latency, versioning, silent decay 잡는 metric

    retrieval ship 되는 순간 모델 문제에서 ops 문제로. 이 트랙은 비용 컨트롤, latency 엔지니어링, 임베딩 versioning, observability, tenant isolation — 6 개월 후에도 retrieval 작동할지 결정하는 discipline.

    Lesson list (5)퀴즈 · 4 문제
  8. 08🧠메모리 시스템 — 피파의 기억

    0/5 lessons

    single-turn 채팅에서 long-term 메모리 가진 stateful AI 까지

    벡터 retrieval 이 모든 long-term AI 메모리 시스템의 substrate. 이 트랙은 episodic vs semantic 메모리, summary 메모리, decay 의 디자인 선택, 그리고 cwkPippa 가 실제로 어떻게 하는지 case study 로 마무리.

    Lesson list (5)퀴즈 · 4 문제
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.