C.W.K.
Stream
Lesson 02 of 05 · published

Star vs Snowflake — 언제 그리고 왜

~9 min · modeling, schema, kimball

Level 0구경꾼
0 XP0/47 lessons0/11 achievements
0/120 XP to next level120 XP to go0% complete

두 layout

  • Star schema. 각 dimension 이 단일 비정규화 테이블. dim_customersname, country, region, segment 다 한 row 에. 다이어그램 모양이 fact 테이블 가운데, dimension 이 밖으로 뻗음 — 그래서 "star".
  • Snowflake schema. Dimension 이 더 정규화. dim_customersregion_key; dim_regionscountry_key; dim_countries 가 그 너머. 모양이 fact 테이블 + sub-dimension 으로 뻗는 dimension — 그래서 "snowflake".

섹시하지 않은 진실

분석 작업엔 star 가 거의 항상 이김. 이유:

  • Query 당 join 적음 → 빠른 실행 + 명확한 SQL.
  • BI 도구가 star schema 에 대해 깔끔한 query 생성.
  • 비정규화 dimension 이 mental model 쉬움.
  • Storage 는 싸; 비정규화의 추가 공간 비용이 가독성 win 대비 무시 가능.

Snowflake schema 도 자리 있음 — sub-dimension 이 거대하고 독립적으로 변할 때 분리가 옳은 선택일 수 있음. 근데 새 분석 warehouse 의 default 는 star schema 고, snowflake 는 평탄 유지의 특정 비용이 정당화할 때만.

Code

같은 dimension, 두 layout·sql
-- Star: 단일 비정규화 customer dimension
CREATE TABLE dim_customers (
    customer_key  INTEGER PRIMARY KEY,
    customer_id   TEXT NOT NULL,
    name          TEXT,
    region_code   TEXT,                         -- 'KR', 'US', 'JP'
    region_name   TEXT,                         -- 'Korea', 'United States', 'Japan'
    continent     TEXT                          -- 'Asia', 'North America'
);

-- Snowflake: customers → regions → continents
CREATE TABLE dim_customers_snow (
    customer_key  INTEGER PRIMARY KEY,
    customer_id   TEXT NOT NULL,
    name          TEXT,
    region_key    INTEGER REFERENCES dim_regions(region_key)
);
CREATE TABLE dim_regions (
    region_key    INTEGER PRIMARY KEY,
    region_code   TEXT NOT NULL,
    region_name   TEXT,
    continent_key INTEGER REFERENCES dim_continents(continent_key)
);
CREATE TABLE dim_continents (
    continent_key INTEGER PRIMARY KEY,
    name          TEXT NOT NULL
);

-- 대륙별 매출 query:
--   star:  fact JOIN dim_customers              (1 join)
--   snow:  fact JOIN dim_customers_snow JOIN dim_regions JOIN dim_continents (3 join)

External links

Exercise

이전 연습에서 sketch 한 dimensional model 에 대해 dimension 마다 결정: star 또는 snowflake? Dimension 마다 한 문장으로 정당화. 연습은 반사 연습 — star 가 default, snowflake 가 그럴 가치 있을 때 명시적으로.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.