같은 테이블, 렌즈 셋
Dataset 은 Arrow-backed. peek 하려고 pandas 변환 안 해도 됨 — 근데 pandas 원하면 한 콜 (ds.to_pandas()), 스키마 허락하면 zero-copy. 컬럼 selection 은 ds.with_format("arrow") 로 pa.Table 가능.
Hub 뷰어
모든 데이터셋 페이지에 Parquet 변환을 auto-쿼리하는 Data Studio 뷰어 있어. 수천 행 빠르게 스캔하는 가장 빠른 방법. 뒤에서 Dataset Viewer API 호출 — 직접 콜 가능: https://datasets-server.huggingface.co/rows?dataset=...&config=...&split=...&offset=0&length=100. 데이터셋 다운 X 하고 sampling 하기 좋음.