모든 분석 팀이 공유하는 어휘
Kimball dimensional model 이 30년간 분석 테이블의 표준 mental model. 어휘 — fact 테이블, dimension 테이블, grain, conformed dimension — 이 모든 warehouse, 모든 dbt 프로젝트, 모든 BI 도구에 나타나. 한 번 배우는 게 평생 분량 명확한 대화 가치 함.
두 종류 테이블
- Fact 테이블 이 일어난 거 담음 — 주문, 페이지뷰, 결제, 센서 reading. 각 row 가 이벤트 또는 측정. Column 대부분 숫자 (measure) + dimension 테이블로의 foreign key.
- Dimension 테이블 이 묘사적 context 담음 — 고객, 제품, store, 날짜. 각 row 가 이벤트 아니라 사물. Column 대부분 속성 (이름, 나라, 카테고리, 색).
Grain — 가장 중요한 단어
Fact 테이블의 grain 이 한 row 가 나타내는 거. "주문당 한 row" 가 grain. "주문 line item 당 한 row" 가 다른 grain. "고객당, 일자당 한 row" 가 또 다른. Grain 잘못하면 그 테이블에 대해 계산하는 모든 metric 이 미묘하게 어긋나 — row 가 잘못된 수준에서 aggregate 되니까. 새 fact 테이블 위해 적을 첫 번째는 grain — 한 문장으로, schema 위에.
Conformed dimension
Conformed dimension 은 같은 key 로 여러 fact 테이블이 사용하는 dimension 테이블. orders fact 테이블 그리고 support_tickets fact 테이블에 join 되는 customers dimension 이 conformed. Conformed dimension 이 많은 source 의 신호 결합하는 "customer-level" metric 을 — 리포트마다 reconciliation 로직 발명 안 하고 — 얻는 방법.