빈도 질문을 푸는 짝
'이 파일/로그/출력에서 가장 흔한 X 는 뭐?' 라는 질문의 답은 항상 sort | uniq -c | sort -rn. 이 주문 외워. 이 한 줄이 한 종류의 질문을 다 풀어.
sort flag
-n— 숫자 정렬 (10 이 9 다음, 1 다음 아님).-r— 역순.-h— 사람용 숫자 (1K, 5M, 2G 정확히 정렬).-u— unique (인라인 중복 제거. uniq 보다 가벼움).-k 2— 두 번째 공백 구분 필드 기준.-t ','— 쉼표 구분자 (CSV).
uniq flag
-c— 각 줄 앞에 개수.-d— 중복만.-u— 중복 아닌 것만.
큰 함정: uniq 는 인접 줄만 dedupe. 거의 항상 sort | uniq, uniq 단독 아님.
빈도 one-liner
cat access.log | awk '{print $1}' | sort | uniq -c | sort -rn | head해석: 로그 줄의 첫 필드 (IP) 추출 → 같은 거 모음 → 개수 세기 → 개수 내림차순 → top 10. 한 파이프로 production 급 분석 쿼리.