식별자
대부분 언어: 문자 또는 underscore, 그 다음 문자/숫자/underscore.
[a-zA-Z_]\w*
네이밍 컨벤션엔:
- camelCase:
[a-z][a-zA-Z0-9]* - snake_case:
[a-z][a-z0-9_]* - SCREAMING_SNAKE:
[A-Z][A-Z0-9_]* - PascalCase:
[A-Z][a-zA-Z0-9]* - kebab-case:
[a-z][a-z0-9-]*
주석
Single-line C 식: //[^\n]* 또는 anchor 된 ^//.*$ + MULTILINE.
Single-line shell/Python: #[^\n]* (false positive 주의 — URL 안 #, 문자열 안).
Multi-line C 식: /\*[\s\S]*?\*/ — 주의 [\s\S], . 대신, DOTALL 플래그 없이 줄바꿈 가로지름.
진짜 주석 감지엔 토크나이저 필요 — 문자열 안 주석-like 패턴이 false positive. 정확성 중요한 소스 코드 처리엔 진짜 파서/AST.
Code mod
정규식이 파일 가로지른 리팩토링에 빛남: 함수 rename, import 변경, config 블록 재구조화. One-shot mod 엔 VS Code 의 정규식 find/replace 또는 sed. 복잡한 리팩토링엔 AST 도구 (Python libcst, JS jscodeshift) 가 더 안전.