제 몫 하는 가장 가벼운 검증
Pandera 는 Pandas (그리고 Polars, Modin, Dask) 용 Pythonic schema 검증 라이브러리. 핵심: 기대하는 schema 선언, schema.validate(df) 호출, 검증된 DataFrame 받거나 모든 위반 자세히 나열한 예외 받기. Silent corruption 을 시끄럽고 디버깅 가능한 실패로 바꾸는 가장 싼 방어 수단.
받는 것
- Type 체크 — column dtype 이 선언된 type 매칭,
coerce=True로 자동 cast. - 제약 체크 — unique, non-null, regex, range, custom predicate.
- Lazy 수집 —
schema.validate(df, lazy=True)가 첫 번째에서 fail 안 하고 전체 DataFrame 위반 다 수집. - DataFrameModel 클래스 — Pydantic 모델 같은 선언적 schema 정의.
- Polars 지원 — Pandera 0.20+ 부터 같은 schema, Polars DataFrame 에 적용.