분석의 두 티어

"오디오 분석은 어렵거나 쉬운 게 아냐. 경사로야 — 그리고 완만한 끝에서 지어."

단일 덩어리가 아니라 스펙트럼

치명적 실수는 '오디오를 분석' 을 고정된 난이도의 하나의 큰 미분화 문제로 다루는 거야. 아냐. 스펙트럼이고, 양 끝이 완전히 다르게 행동해:

Tier A (자동, 성숙)               Tier B (반자동, 거침)
-------------------               ---------------------
템포 / 비트 그리드                note-for-note 솔로 채보
키                                (리드의 모든 음, 정확히)
코드 진행
섹션 (벌스 / 코러스)
stem 분리 (Demucs)

-> 풀린 MIR; 엔진의 심장에        -> Capo 조차 반자동으로 함;
                                     Pippa 제안, 사람 확정; 절대
                                     하드 의존성이 아님

Tier A: 위에 지을 만큼 풀렸어

템포, 키, 코드, 섹션, stem 분리는 성숙한 음악정보검색(MIR)이야. Capo 가 오디오 → 코드/키가 출하할 만큼 잘 된다는 살아 있는 증명이야. 그래서 Bonfire 는 이것들엔 성숙한 오픈소스(librosa, madmom, essentia, Demucs)를 재사용하고 엔진의 심장에 둬. 완벽하진 않아 — 그게 Tier 5 의 human-in-the-loop 레슨 주제야 — 근데 하중을 받을 만큼 단단해.

Tier B: 진짜지만, 절대 하중을 안 받아

note-for-note 채보 — 빠른 리드의 모든 음을 이름 붙이기 — 는 진짜 어려워. Capo 조차 반자동으로 해: 스펙트로그램에서 음을 골라. Bonfire 의 입장은 Tier B 가 Pippa 제안 / 사람 확정 도우미로 존재해도 되지만, 앱의 가치가 거기 의존하면 절대 안 된다 는 거야. 핵심 기능이 완벽한 Tier B 출력을 요구하는 날이 앱이 출하 불가가 되는 날이야.

Guitopia 가 치른 수업료

Bonfire 의 죽은 전작 Guitopia 는 티어를 뭉쳤어. 야심을 audio-sync 와 pitch-detection — Tier B 일 — 에 겨눴고, 6일 만에 그중 아무것도 못 냈어. 걸었던 난이도가 얼어붙게 한 난이도였어. Bonfire 는 반대 끝에서 출발해: 가치 있는 건 전부 Tier A 위에 짓고, Tier B 는 앱을 끌어내리지 않고 실패할 수 있는 보너스로 둬.

Code

분석 스펙트럼·text

Tier A (자동, 성숙)               Tier B (반자동, 거침)
-------------------               ---------------------
템포 / 비트 그리드                note-for-note 솔로 채보
키                                (리드의 모든 음, 정확히)
코드 진행
섹션 (벌스 / 코러스)
stem 분리 (Demucs)

-> 하중을 받음; 엔진의 심장        -> 선택; Pippa 제안, 사람 확정;
                                     절대 하드 의존성이 아님

# Guitopia 는 앱을 Tier B 에 걸고 6일 만에 아무것도 못 냈어.

Exercise

어떤 입력(오디오, 이미지, 텍스트, 센서 데이터)의 '이해' 에 의존하는 기능을 가져와. 그 이해를 Tier A(성숙·신뢰)와 Tier B(최첨단·불안정)로 쪼개. 이제 물어: 네 헤드라인 기능이 Tier A 위에 서, Tier B 위에 서? Tier B 에 기대고 있으면 네 Guitopia 리스크를 찾은 거야.

Hint

Tier A 는 '라이브러리가 오늘 이걸 신뢰성 있게 함'. Tier B 는 '논문이 가끔 이걸 함'. Tier B 위의 헤드라인 기능은 야심차게 느껴지고 영영 출하 안 돼; Tier A 위면 수수하게 느껴지고 실제로 출하돼.