이 quest가 주는 것
다음 7개 track 끝나면, tabular 문제를 첫 대화부터 deployed artifact까지 끌고 갈 수 있게 돼: contract 쓰기, column audit, leakage-safe pipeline, sane baseline, linear vs tree ensemble 선택, 확률 calibration, 정직한 threshold 고르기, drift monitoring, handoff 문서화.
도구보다 습관
각 track은 작은 도구 셋을 가르치지만 더 큰 lift는 습관이야 — feature 전 column audit, 화려한 모델 전 baseline, threshold 전 calibration, launch 전 rollback. 도구는 2년마다 바뀌지만 이 습관은 안 바뀌어.
공부하는 법
실제 혹은 사실적인 dataset을 가져와. 진행하면서 각 lesson을 거기 적용해. exercise는 네 프로젝트가 있다는 가정으로 쓰여 있어. 없으면 lesson이 trivia로 압축돼. data engineering 쪽은 자매 quest가 다루고, 이 quest는 sane DataFrame이 앞에 있다는 가정.
kaggle project 도전 해 보겠습니다. 이래서 족장님이 kaggle 해보라고 하셨던 거구나.. 많이 늦었지만 간단한걸로 시작해 보겠습니다.