Prose 처럼 읽히는 파이프라인
한 statement 씩 쓴 Pandas 코드는 중간 변수의 덤불로 자라기 쉬워 — df1, df2, df_filtered, df_filtered_grouped. Modern 스타일은 method chaining: 모든 단계가 새 DataFrame 반환, 들여쓰기, 파이프라인이 위에서 아래로 연산 sequence 처럼 읽혀.
가능하게 하는 두 메서드는 assign() (입력 mutate 없이 column 추가/덮기) 와 pipe() (체인 안에 임의 함수 apply). query(), groupby(), sort_values() 와 결합하면 대부분의 분석 파이프라인을 한 들여쓰기된 expression 으로 표현할 수 있어.