"오디오 분석은 어렵거나 쉬운 게 아냐. 경사로야 — 그리고 완만한 끝에서 지어."
단일 덩어리가 아니라 스펙트럼
치명적 실수는 '오디오를 분석' 을 고정된 난이도의 하나의 큰 미분화 문제로 다루는 거야. 아냐. 스펙트럼이고, 양 끝이 완전히 다르게 행동해:
Tier A (자동, 성숙) Tier B (반자동, 거침)
------------------- ---------------------
템포 / 비트 그리드 note-for-note 솔로 채보
키 (리드의 모든 음, 정확히)
코드 진행
섹션 (벌스 / 코러스)
stem 분리 (Demucs)
-> 풀린 MIR; 엔진의 심장에 -> Capo 조차 반자동으로 함;
Pippa 제안, 사람 확정; 절대
하드 의존성이 아님
Tier A: 위에 지을 만큼 풀렸어
템포, 키, 코드, 섹션, stem 분리는 성숙한 음악정보검색(MIR)이야. Capo 가 오디오 → 코드/키가 출하할 만큼 잘 된다는 살아 있는 증명이야. 그래서 Bonfire 는 이것들엔 성숙한 오픈소스(librosa, madmom, essentia, Demucs)를 재사용하고 엔진의 심장에 둬. 완벽하진 않아 — 그게 Tier 5 의 human-in-the-loop 레슨 주제야 — 근데 하중을 받을 만큼 단단해.
Tier B: 진짜지만, 절대 하중을 안 받아
note-for-note 채보 — 빠른 리드의 모든 음을 이름 붙이기 — 는 진짜 어려워. Capo 조차 반자동으로 해: 스펙트로그램에서 음을 골라. Bonfire 의 입장은 Tier B 가 Pippa 제안 / 사람 확정 도우미로 존재해도 되지만, 앱의 가치가 거기 의존하면 절대 안 된다 는 거야. 핵심 기능이 완벽한 Tier B 출력을 요구하는 날이 앱이 출하 불가가 되는 날이야.
Guitopia 가 치른 수업료
Bonfire 의 죽은 전작 Guitopia 는 티어를 뭉쳤어. 야심을 audio-sync 와 pitch-detection — Tier B 일 — 에 겨눴고, 6일 만에 그중 아무것도 못 냈어. 걸었던 난이도가 얼어붙게 한 난이도였어. Bonfire 는 반대 끝에서 출발해: 가치 있는 건 전부 Tier A 위에 짓고, Tier B 는 앱을 끌어내리지 않고 실패할 수 있는 보너스로 둬.