cut — 컬럼 슬라이스
cut 이 구조화 입력에서 필드 추출. 세 모드:
cut -f 2— 두 번째 탭 구분 필드.cut -d ',' -f 1,3— 쉼표 구분 1, 3 번째.cut -c 1-10— 각 줄의 첫 10 글자.cut -d ' ' -f 2-— 2 번째부터 끝까지.
CSV, TSV, 고정 구분자 로그에 좋아. 복잡한 파싱은 awk (다음 트랙).
tr — 문자 변환 / 삭제
tr 가 stdin 을 글자 단위로 읽어서 변환. 주요 형:
tr 'a-z' 'A-Z'— 대문자 변환.tr -d ' '— 공백 삭제.tr -s ' '— 연속 공백을 하나로.tr -c 'a-zA-Z0-9' '_'— 영숫자가 아닌 거 다_으로 (complement).
현실 콤보
- 로그의 unique IP:
cut -d ' ' -f 1 access.log | sort -u - 파일을 소문자로:
tr 'A-Z' 'a-z' < INPUT > output - Windows 줄바꿈 제거:
tr -d '\r' < in.txt > out.txt - 탭을 공백으로:
tr '\t' ' '
cut 의 한계
cut 은 따옴표 안 쉼표 (quoted CSV) 처리 못 해. 진짜 CSV 는 csvkit, miller, Python csv 모듈로. 단순 구분 로그엔 cut 충분.