두 flavor
Supervised anomaly detection이 알려진 anomaly에 label 있음 — extreme imbalance 동반한 classification으로 다뤄. Unsupervised anomaly detection이 label 없고 anomaly가 rare하고 구조적으로 다르다고 가정. unsupervised case가 보통 사람들이 의미하는 거.
중요한 알고리즘
- IsolationForest — 빠름, scale 잘됨, distance 가정 X.
- LocalOutlierFactor — density-based, local 맥락에 민감.
- One-class SVM — normal 데이터 주변 boundary. 큰 dataset엔 비쌈.
- Autoencoder reconstruction error — high-dimensional input(image, sensor)용.
label 없는 evaluation
ground truth 없이 evaluation은 절반 예술. top score sample 후 사람 review. precision-at-K(top K alert 중 진짜 비율) 추적. 사람 review를 label로 wire back 하고 점진적으로 supervised classification으로 이동.